A União Europeia abriu uma investigação para saber como o Google treinou o PaLM 2, modelo de IA generativa. O bloco econômico quer descobrir se a big tech respeitou as políticas de privacidade dos usuários para desenvolver o LLM. O PaLM 2 é um modelo de linguagem lançado em 2022, antecedendo a criação do Gemini.
O responsável por investigar o Google é a Comissão de Proteção de Dados da Irlanda. O órgão costuma liderar esses processos pelo fato da maioria das empresas americanas terem a sua sede europeia no país. Tanto que é na Irlanda que as empresas costumam pagar seus impostos — inclusive a Apple tem uma dívida bilionária no país.
UE investiga treinamento do PaLM 2
Além da atuação da Comissão de Proteção de Dados da Irlanda, os órgãos reguladores dos outros países da União Europeia estão contribuindo para a investigação. O bloco quer entender se houve violação do Regulamento Geral sobre a Proteção de Dados (GPDR na sigla em inglês).
LLMs dependem de uma enorme quantidade de dados para serem treinados. Por isso, para criarem uma IA generativa altamente competitiva, as big techs precisam “raspar” a internet para adquirir a maior quantidade possível de informações.
A preocupação dos membros da UE é entender se as regras sobre o processamento de dados privados foi respeitado. Na Austrália, a Meta revelou em uma audiência no senado do país que usou todos os dados gerados no Facebook e Instagram desde 2007 para treinar a sua inteligência artificial.
Na busca por uma IA competitiva, há o risco de que algumas medidas básicas de privacidade tenham sido ignoradas para lançar um produto capaz de rivalizar com modelos já em operação.
No início de setembro, o órgão irlandês convenceu o X a parar de usar dados de usuários europeus para treinar o Grok, IA generativa da empresa. Já a Meta interrompeu o plano de usar dados de moradores da UE para treinar a sua inteligência artificial — a big tech também permite que os usuários brasileiros neguem o uso dos seus dados para treinamento da IA.
PaLM 2 é o “pai” do Gemini
O PaLM 2 e o Gemini são membros da mesma família de modelo de linguagem grande, sendo que o PaLM 2 é uma versão mais antiga do LLM do Google. Em 2024, a big tech passou a adotar o nome “Gemini” tanto para a sua IA generativa quanto para o modelo de linguagem — o que pode soar confuso para algumas pessoas.
Com informações: Reuters, AP News e Android Headlines
UE vai investigar como o Google treinou a IA PaLM 2