Resumo
  • A OpenAI lançou no Brasil o Operator, um agente de IA projetado para navegação em sites.
  • Por enquanto, o Operator está disponível apenas para assinantes do ChatGPT Pro, que custa US$ 200 mensais (aproximadamente R$ 1.140).
  • O Operator é capaz de realizar tarefas complexas em sites, interagindo com elementos gráficos como botões e menus.
  • Google, Anthropic e Rabbit também estão desenvolvendo agentes de IA semelhantes, com a capacidade de navegar e interagir em computadores e dispositivos.

A OpenAI liberou no Brasil o Operator, seu agente com inteligência artificial capaz de navegar em sites e realizar diversas tarefas, como se fosse um humano usando mouse e teclado. Assim, ela pode reservar restaurantes, fazer compras ou preencher formulários, entre outras possibilidades.

Por enquanto, o Operator ainda está em fase de preview e limitado apenas a assinantes do ChatGPT Pro, que custa US$ 200 mensais (cerca de R$ 1.140, em conversão direta). A ferramenta não está integrada ao ChatGPT e tem um site dedicado.

O Operator foi lançado nos Estados Unidos em janeiro. Ele chegou a mais países além do Brasil nesta sexta-feira (21/02): Austrália, Canadá, Coreia do Sul, Índia, Japão, Reino Unido e Singapura, entre muitos outros. A OpenAI promete levar sua ferramenta para a maioria dos lugares onde o ChatGPT está disponível, exceto para a União Europeia, Suíça, Noruega, Liechtenstein e Islândia.

O que o Operator pode fazer?

A ideia do Operator é que ele realize tarefas complexas, que necessitam de muitos passos, a partir de um comando simples.

Um exemplo que a OpenAI dá em seu site é o prompt “Encontre e reserve o tour diário por Roma com a melhor avaliação no Tripadvisor”. O agente, então, navega pelo site, faz a busca, organiza os resultados, entra no melhor avaliado e faz a reserva, como se fosse um humano.

Como o Operator funciona?

O Operator funciona como um agente para uso de computador (CUA, na sigla em inglês). Ele é treinado para interagir com interfaces gráficas, como botões, menus e campos para preenchimento de texto.

A tecnologia combina computação visual, para “ver” as páginas a partir de capturas de tela, e IA para controlar o computador, sabendo mandar instruções para mouse e teclado. Com esta abordagem, o Operator tem potencial para “se virar” em qualquer site, mesmo que não haja uma integração via API, por exemplo.

Na prática, porém, ele ainda não funciona também. Caso encontre um problema, ele pode pedir ajuda a algum humano. Em algumas situações específicas, a intervenção é sempre necessária, como fazer login, fornecer dados de cartão de crédito e resolver captchas.

Quais outros agentes de IA estão sendo desenvolvidos?

Google, Anthropic e Rabbit são alguns exemplos de empresas que também estão criando ferramentas de IA capazes de navegar na web e realizar tarefas.

  • O Google tem o Project Mariner, que visa desenvolver uma extensão para o Chrome capaz de entender o que está na tela e realizar tarefas.
  • A Anthropic tem o Claude 3.5 Sonnet, que pode controlar o computador e interagir com qualquer programa instalado.
  • A Rabbit, que produz o aparelhinho Rabbit R1, demonstrou nesta quinta-feira (20/02) uma IA capaz de controlar um tablet de Android.

Com informações de TechCrunch

Operator: agente da OpenAI que realiza tarefas na web chega ao Brasil