Les actions Meta Platforms (META) ont légèrement baissé en début de séance après qu'un groupe de grands éditeurs a déposé un vaste recours judiciaire accusant la société d'avoir utilisé des livres protégés par le droit d'auteur et des matériaux académiques sans autorisation pour entraîner ses modèles d'IA Llama.
L'action en justice, déposée devant le tribunal fédéral de Manhattan le 5 mai, a intensifié les préoccupations concernant la manière dont les grandes entreprises technologiques se procurent des données d'entraînement pour les systèmes d'intelligence artificielle générative.
Les plaignants comprennent de grandes maisons d'édition académique et généraliste telles qu'Elsevier, Cengage, Hachette, Macmillan et McGraw Hill, ainsi que l'auteur Scott Turow. L'affaire allègue que Meta a utilisé des millions d'œuvres protégées, notamment des manuels scolaires, des articles de recherche scientifique et des romans bien connus, pour développer ses systèmes d'IA sans avoir obtenu les accords de licence appropriés.
Selon la plainte, les ensembles de données d'entraînement auraient inclus une vaste gamme de matériaux protégés par le droit d'auteur couvrant des manuels scolaires, de la littérature scientifique et des titres de fiction. Parmi les œuvres citées figurent The Fifth Season de N.K. Jemisin et The Wild Robot de Peter Brown, soulignant l'étendue du contenu qui aurait été intégré dans le pipeline d'entraînement de l'IA de Meta.
Meta Platforms, Inc., META
Les éditeurs soutiennent que l'utilisation non autorisée de ces œuvres viole les droits de propriété intellectuelle et réclament des dommages et intérêts ainsi que des protections juridiques plus larges pour les propriétaires de contenu dont les matériaux auraient pu être utilisés dans le développement de l'IA sans consentement.
Le procès ajoute une pression supplémentaire au débat mondial croissant sur la question de savoir si l'utilisation de matériaux protégés par le droit d'auteur pour l'entraînement de l'IA relève de l'« usage équitable ». Les entreprises technologiques, y compris Meta, ont à plusieurs reprises soutenu que l'entraînement de modèles d'IA sur des ensembles de données à grande échelle est transformateur et relève des protections de l'usage équitable.
Cependant, les créateurs et les éditeurs sont en profond désaccord, affirmant que de telles pratiques reproduisent effectivement du contenu protégé sans compensation. L'affaire rejoint des procès similaires contre OpenAI et Anthropic, signalant un front juridique s'élargissant dans l'industrie de l'IA. Un récent règlement impliquant Anthropic, d'une valeur d'environ 1,5 milliard de dollars, a déjà montré que les tribunaux pourraient distinguer entre les données obtenues légalement et les matériaux piratés dans les futures décisions.
Au-delà des réclamations judiciaires, des reportages antérieurs ont mis en lumière des préoccupations supplémentaires concernant les pratiques d'approvisionnement en données de Meta. Des dépôts judiciaires dans des affaires connexes suggèrent que la société aurait accédé à des ensembles de données provenant de bibliothèques fantômes telles que LibGen et Anna's Archive, avec des allégations selon lesquelles des dizaines de téraoctets de données auraient été obtenus via des canaux de torrenting.
Des discussions internes auraient révélé des préoccupations parmi les chercheurs et les ingénieurs concernant les implications éthiques de l'utilisation de tels ensembles de données. Certains employés auraient soulevé des objections à l'utilisation de matériaux piratés, tandis que d'autres débattaient de la question de savoir si l'octroi de licences pour des œuvres individuelles compromettrait la stratégie de défense plus large de Meta en matière d'usage équitable.
The post Meta (META) Stock; Edges Lower as Publishers Sue Over Llama AI Training Data Claims appeared first on CoinCentral.


