Marca "G" do Google
União Europeia quer saber se o Google respeitou a privacidade dos usuários europeus para treinar sua IA (Ilustração: Vitor Pádua/Tecnoblog)

A União Europeia abriu uma investigação para saber como o Google treinou o PaLM 2, modelo de IA generativa. O bloco econômico quer descobrir se a big tech respeitou as políticas de privacidade dos usuários para desenvolver o LLM. O PaLM 2 é um modelo de linguagem lançado em 2022, antecedendo a criação do Gemini.

O responsável por investigar o Google é a Comissão de Proteção de Dados da Irlanda. O órgão costuma liderar esses processos pelo fato da maioria das empresas americanas terem a sua sede europeia no país. Tanto que é na Irlanda que as empresas costumam pagar seus impostos — inclusive a Apple tem uma dívida bilionária no país.

UE investiga treinamento do PaLM 2

Além da atuação da Comissão de Proteção de Dados da Irlanda, os órgãos reguladores dos outros países da União Europeia estão contribuindo para a investigação. O bloco quer entender se houve violação do Regulamento Geral sobre a Proteção de Dados (GPDR na sigla em inglês).

Marca do Gemini em cores claras, num fundo azul
Gemini é o sucessor do PaLM 2 e parte do seu conhecimento vem do treinamento desse LLM (Imagem: Vitor Pádua/Tecnoblog)

LLMs dependem de uma enorme quantidade de dados para serem treinados. Por isso, para criarem uma IA generativa altamente competitiva, as big techs precisam “raspar” a internet para adquirir a maior quantidade possível de informações.

A preocupação dos membros da UE é entender se as regras sobre o processamento de dados privados foi respeitado. Na Austrália, a Meta revelou em uma audiência no senado do país que usou todos os dados gerados no Facebook e Instagram desde 2007 para treinar a sua inteligência artificial.

Na busca por uma IA competitiva, há o risco de que algumas medidas básicas de privacidade tenham sido ignoradas para lançar um produto capaz de rivalizar com modelos já em operação.

No início de setembro, o órgão irlandês convenceu o X a parar de usar dados de usuários europeus para treinar o Grok, IA generativa da empresa. Já a Meta interrompeu o plano de usar dados de moradores da UE para treinar a sua inteligência artificial — a big tech também permite que os usuários brasileiros neguem o uso dos seus dados para treinamento da IA.

PaLM 2 é o “pai” do Gemini

O PaLM 2 e o Gemini são membros da mesma família de modelo de linguagem grande, sendo que o PaLM 2 é uma versão mais antiga do LLM do Google. Em 2024, a big tech passou a adotar o nome “Gemini” tanto para a sua IA generativa quanto para o modelo de linguagem — o que pode soar confuso para algumas pessoas.

Com informações: Reuters, AP News e Android Headlines

UE vai investigar como o Google treinou a IA PaLM 2