Um estudo divulgado pela AWS nesta semana indica que 57% do conteúdo textual da internet já é gerado por IAs. A pesquisa mostra que a maioria do que é publicado na rede é tradução criada com Machine Translation, inteligências artificiais focadas em traduzir textos. Contudo, isso não é só ruim para os usuários e criadores, mas também prejudica o treinamento de IAs generativas.
Como os LLMs dependem de conteúdo humano e especializado para entregar uma informação mais precisa, a replicação de textos utilizando IAs e apenas com traduções impacta no desempenho das IAs generativas.
O estudo da AWS destaca que as traduções são falhas porque vêm de textos mal escritos. Consequentemente, esse material traduzido entregará informações erradas ou de má-qualidade para os usuários. Além disso, ainda há a questão de que o LLM “reciclará” conteúdos para o seu treinamento — é IA treinando IA, quase um esquema de pirâmide.
Qualidade das respostas cai a cada prompt
A pesquisa mostra que a qualidade e precisão das respostas geradas pelo LLMs cai com o tempo. Se você acha que a IA do Google sugerir passar cola na pizza é ruim, espere mais alguns anos.
Para quem usa o ChatGPT, Gemini, Copilot ou outra IA para tarefas mais simples, essa queda de qualidade pode passar despercebida. Apesar disso, no fim de 2023 e início de 2024 tivemos o caso da “preguiça” do ChatGPT. Na Comunidade do Tecnoblog, alguns leitores já reclamaram de uma certa queda de qualidade das IAs generativas.
O estudo da AWS aponta uma solução para isso: o uso de tecnologias de detecção de material gerado por Machine Translation (MT). Ao contrário dos tradutores básicos, que praticamente traduzem palavra por palavra, as MTs usam IAs para avaliar o contexto do texto.
Com informações: Windows Central
57% do conteúdo na web foi criado por robôs, mostra estudo