IA finge que é humana e consegue derrubar os captchas do Google

Cientistas da universidade ETH Zurich, na Suíca, treinaram uma inteligência artificial para que ela conseguisse resolver os captchas do Google, que existem para determinar se quem está tentando acessar um serviço é realmente de carne e osso. Ela não chegou a demonstrar 100% de precisão na hora de resolver os desafios, mas foi capaz de superar as barreiras com as mesmas taxas de sucesso que pessoas reais.

O estudo usou o Recaptcha v2, do Google. Você já deve ter passado por ele: o teste pede para o usuário identificar semáforos, faixas de pedestre, pontes e outros itens da paisagem urbana.

Captcha com nove fotos de paisagens urbanas. Usuário deve clicar naquelas que têm carros. — Modelo treinado por pesquisadores de universidade suíça aprendeu a identificar objetos (Imagem: Reprodução / Google Cloud)

Para responder às questões, os pesquisadores treinaram um modelo de processamento de imagens chamado Yolo (sigla para “you only live once”, ou “você só vive uma vez”). O treinamento usou 14 mil fotos de ruas devidamente etiquetadas. Também é importante notar que o modelo não funciona sozinho, precisando de intervenção humana para operar.

Pouco tempo depois, o Yolo conseguia reconhecer os objetos tão bem quanto um humano. Ao cometer algum erro pequeno, o Recaptcha v2 liberava mais um puzzle. Assim, com mais de uma tentativa, a IA sempre conseguia convencer o sistema de que era uma pessoa real.

Google diz que IA não põe sistema em risco

Não é a primeira vez que um sistema computadorizado consegue se sair bem na hora de resolver captchas. Há dez anos, este mesmo Tecnoblog noticiava que um software dava a resposta certa em 90% das tentativas, e existiam até serviços que empregavam humanos para passar pelos testes.

Especialistas consultados pela reportagem do Decrypt consideram que as máquinas estão cada vez melhores em resolver estes desafios. Chegará um momento em que eles não serão mais suficientes para determinar se tem um humano por trás daquele acesso.

Mesmo assim, o Google considera que risco não é tão grande quanto parece e tem seus motivos para acreditar nisso: o Recaptcha vai além dos captchas.

“Nós nos concentramos em ajudar nossos clientes a proteger seus usuários sem precisar de desafios visuais”, explica à New Scientist um representante do Google Cloud. “Hoje, a maioria das proteções oferecidas pelo Recaptcha a 7 milhões de sites é completamente invisível.”

A versão 3 da tecnologia do Google consegue analisar se um visitante é humano ou robô levando em consideração a atividade na página. É por isso que, às vezes, você clica na caixinha “Não sou um robô” e o teste nem aparece.

Marca "G" do Google — Google é responsável pela tecnologia do Recaptcha (Ilustração: Vitor Pádua/Tecnoblog)

O material da ETH Zurich leva estes aspectos em consideração. Os cientistas descobriram que o Recaptcha mostra menos captchas quando detecta movimento do mouse ou a existência de histórico e cookies no navegador, pois estes são indícios de que uma pessoa realmente está usando o computador.

Em outro teste, eles concluíram que o uso de VPN para mudar o IP também reduz o número de desafios exigidos. O sistema considera que muitos acessos consecutivos de um mesmo IP significam um comportamento automatizado.

Por isso, os testes foram realizados usando VPN, simulação de movimento do mouse e um navegador com histórico de navegação e cookies. Essas precauções foram tomadas porque o objetivo dos pesquisadores era analisar apenas a capacidade da IA em resolver os captchas, sem que outros comportamentos influenciassem no processo.

Captchas ajudam a treinar máquinas

Além de separar humanos de robôs, os captchas também têm outro propósito: as respostas dadas são usadas para treinar os próprios sistemas do Google, para que eles reconheçam objetos em imagens.

O Recaptcha, aliás, nasceu como um projeto da Universidade Carnegie Mellon, nos Estados Unidos, para ajudar a digitalizar livros antigos. Quando uma palavra não era reconhecida por sistemas automáticos, humanos contribuíam para identificar o que estava escrito ali.

Com informações: Decrypt, ZDNet e TechRadar

IA finge que é humana e consegue derrubar os captchas do Google