Duas grandes editoras norte-americanas, Hachette Book Group e Cengage Group, solicitaram a um tribunal federal da Califórnia autorização para participar de uma ação coletiva que acusa o Google de usar material protegido por direitos autorais para treinar sistemas de inteligência artificial (IA) sem permissão. O pedido foi protocolado na quinta-feira, 15 de janeiro, e se soma a uma série de disputas judiciais envolvendo a utilização de obras protegidas no desenvolvimento de modelos de IA.
Pedido formal apresentado na Califórnia
O litígio principal corre na Corte Distrital dos Estados Unidos para o Norte da Califórnia e, até o momento, envolve um grupo de artistas visuais que processa o Google por suposto uso indevido de suas criações em um gerador de imagens baseado em IA. Com a petição recém-apresentada, Hachette e Cengage pretendem integrar a mesma ação como representantes de autores e editoras afetados.
De acordo com o documento enviado ao tribunal, as empresas alegam que o Google “praticou uma das violações mais extensas de direitos autorais da história” ao copiar textos de livros da Hachette e de livros didáticos da Cengage para treinar seus modelos de linguagem, atualmente reunidos sob a marca Gemini. As editoras afirmam que não concederam qualquer licença para esse uso e que a conduta compromete o valor econômico das obras originais.
A decisão sobre o ingresso das editoras caberá à juíza distrital Eumi Lee, responsável pelo caso. Caso o tribunal aceite a inclusão, o processo deixará de se concentrar apenas nas artes visuais e passará a abranger também textos literários e educacionais.
Processo aponta uso de obras sem licença
No pedido, os advogados das editoras listam dez exemplos de livros que teriam sido copiados sem autorização. Entre eles aparecem obras de autores reconhecidos, como Scott Turow e N.K. Jemisin. As empresas requerem uma indenização ainda não especificada, tanto para si mesmas quanto para uma classe mais ampla de escritores e editoras potencialmente prejudicados.
Maria Pallante, diretora-executiva da Association of American Publishers (AAP), declarou que a participação das editoras pode “fortalecer o caso”, uma vez que essas empresas dispõem de documentação detalhada capaz de esclarecer questões legais, factuais e probatórias. A representante diz acreditar que a violação afeta diretamente a sustentabilidade da criação editorial e, por consequência, o acesso do público a conteúdo de qualidade.
O Google não se manifestou até o momento sobre as alegações nem sobre o pedido de ampliação da ação coletiva. A companhia já enfrenta processos semelhantes apresentados por artistas, autores, gravadoras e outras entidades que questionam a utilização de conteúdos protegidos no treinamento de modelos de IA.
Imagem: Internet
Contexto de ações contra empresas de IA
Disputas judiciais envolvendo direitos autorais e inteligência artificial vêm ganhando força nos Estados Unidos. Em 2023, a startup Anthropic firmou acordo estimado em 1,5 milhão de dólares para encerrar uma ação movida por um grupo de autores que acusava a empresa de usar suas obras no treinamento do chatbot Claude. O caso da Anthropic é frequentemente citado como precedência relevante para processos contra outras empresas de tecnologia.
A pressão sobre plataformas de IA reflete preocupações de criadores quanto à reprodução de conteúdo protegido e ao possível impacto sobre suas fontes de renda. Organizações de defesa de direitos autorais sustentam que o uso de obras sem autorização para fins comerciais viola a lei norte-americana, enquanto empresas de tecnologia argumentam que o treinamento de IA se enquadraria em princípios de uso justo ou em outras exceções legais.
Próximos passos no tribunal
Se a juíza Eumi Lee aprovar a entrada de Hachette e Cengage na ação coletiva, o processo passará a reunir demandas de artistas visuais, autores literários e editoras em um mesmo litígio. A corte, então, decidirá se certifica a classe — etapa que definirá quem poderá ser representado na ação e quais prejuízos financeiros serão considerados.
Nesse cenário ampliado, o Google poderá ter de fornecer informações adicionais sobre os datasets usados no treinamento do Gemini, esclarecer critérios de seleção de conteúdo e justificar eventuais práticas de cópia de material protegido. Eventuais acordos ou sentenças poderão servir de referência para outros casos que tramitam contra plataformas de IA.
Não há prazo definido para que o tribunal decida sobre o pedido das editoras, mas especialistas apontam que a análise costuma demorar vários meses. Até lá, o debate sobre a fronteira entre inovação tecnológica e proteção de direitos autorais continuará a evoluir nos tribunais norte-americanos.





