As ações da Meta Platforms (META) caíram ligeiramente no início das negociações após um grupo de grandes editoras ter apresentado um processo judicial abrangente acusando a empresa de utilizar livros protegidos por direitos de autor e materiais académicos sem permissão para treinar os seus modelos de IA Llama.
A ação legal, apresentada no tribunal federal de Manhattan a 5 de maio, intensificou as preocupações em torno da forma como as principais empresas tecnológicas obtêm dados de treino para sistemas de inteligência artificial generativa.
Os demandantes incluem grandes casas académicas e editoras como a Elsevier, Cengage, Hachette, Macmillan e McGraw Hill, juntamente com o autor Scott Turow. O processo alega que a Meta utilizou milhões de obras protegidas, incluindo manuais escolares, artigos de investigação científica e romances conhecidos, para desenvolver os seus sistemas de IA sem obter os devidos acordos de licenciamento.
De acordo com a queixa, os conjuntos de dados de treino teriam incluído uma vasta gama de materiais protegidos por direitos de autor, abrangendo manuais educativos, literatura científica e títulos de ficção. Entre as obras citadas encontram-se The Fifth Season, de N.K. Jemisin, e The Wild Robot, de Peter Brown, evidenciando a amplitude do conteúdo que terá sido incorporado no pipeline de treino de IA da Meta.
Meta Platforms, Inc., META
As editoras argumentam que a utilização não autorizada destas obras viola os direitos de propriedade intelectual e estão a exigir indemnizações, bem como proteções legais mais amplas para os proprietários de conteúdos cujos materiais possam ter sido utilizados no desenvolvimento de IA sem consentimento.
O processo acrescenta mais pressão ao crescente debate global sobre se a utilização de material protegido por direitos de autor para o treino de IA se qualifica como "uso justo". As empresas tecnológicas, incluindo a Meta, têm argumentado repetidamente que treinar modelos de IA em conjuntos de dados de grande escala é transformador e enquadra-se nas proteções de uso justo.
No entanto, os criadores e as editoras discordam veementemente, alegando que tais práticas replicam efetivamente conteúdo protegido sem compensação. O caso junta-se a processos semelhantes contra a OpenAI e a Anthropic, sinalizando uma frente legal cada vez mais ampla na indústria de IA. Um acordo recente envolvendo a Anthropic, no valor de aproximadamente 1,5 mil milhões de dólares, já demonstrou que os tribunais poderão distinguir entre dados obtidos legalmente e material pirateado em decisões futuras.
Para além das alegações em tribunal, reportagens anteriores destacaram preocupações adicionais sobre as práticas de obtenção de dados da Meta. Documentos judiciais em casos relacionados sugerem que a empresa poderá ter acedido a conjuntos de dados de bibliotecas clandestinas como a LibGen e o Anna's Archive, com alegações de que dezenas de terabytes de dados foram obtidos através de canais de torrenting.
Discussões internas terão revelado preocupações entre investigadores e engenheiros sobre as implicações éticas da utilização de tais conjuntos de dados. Alguns funcionários terão levantado objeções à utilização de material pirateado, enquanto outros debateram se o licenciamento de obras individuais poderia comprometer a estratégia de defesa de uso justo mais ampla da Meta.
The post Meta (META) Stock; Edges Lower as Publishers Sue Over Llama AI Training Data Claims appeared first on CoinCentral.


