Des auteurs ont décidé, outre Atlantique, de porter plainte contre les principales sociétés de l’IA. Comme dans d’autres procédures, les écrivains accusent les géants du secteur d’avoir utilisé des bibliothèques illicites, dans lesquelles se trouvent leurs oeuvres, pour entraîner leurs systèmes. Ce sans autorisation et en violation de leur droit d’auteur, selon ces derniers.
Les outils d’IA comme ChatGPT, Llama, Gemini, Anthropic et xAI ont-ils été entraînés sur des livres protégés par le copyright, l’équivalent du droit d’auteur outre Atlantique, sans autorisation ? C’est à nouveau l’accusation lancée par six auteurs aux États-Unis. Ces derniers ont porté plainte, lundi 22 décembre,contre xAI d’Elon Musk, Anthropic, Google, OpenAI, Meta et Perplexity, devant la cour fédérale de Californie. Ils estiment que les six entreprises d’IA ont piraté leurs œuvres, avant de les utiliser pour entraîner leurs grands modèles de langage : un usage non autorisé dont ils cherchent à obtenir réparation. Parmi les auteurs se trouve John Carreyrou, journaliste au New York Times, et également auteur.
« Plutôt que d’obtenir des licences ou de payer pour l’utilisation de ces œuvres, chaque (société de l’IA) a téléchargé des copies piratées des livres des (auteurs) à partir de sites Web de bibliothèques parallèles, telles que LibGen, Z-Library et OceanofPDF. (Elles ont ensuite) reproduit, analysé, copié à nouveau, utilisé et intégré ces œuvres dans leurs LLM (et/ou utilisé ces œuvres pour optimiser leur produit) afin d’accélérer le développement commercial et de gagner la course à l’IA générative », écrivent les auteurs de la plainte, dont Reuters se fait l’écho. Or, les œuvres piratées et utilisées sans autorisation ont permis de « construire des systèmes qui valent aujourd’hui plusieurs centaines de milliards de dollars », ajoutent-ils.
Les bibliothèques pirates au cœur d’autres litiges
Ces bibliothèques pirates, comme LibGen, Z-Library et OceanofPDF, sont mises en cause dans bon nombre d’actions en justice intentées par des créateurs ou des ayants droit, pour le même motif. En France, Mediapart a révélé, le 22 décembre dernier, que Mistral aurait aussi utilisé LibGen pour entraîner son modèle de langage. Anthropic, Meta et Apple, dans d’autres affaires, sont aussi accusées d’avoir utilisé la même bibliothèque illicite pour entraîner leurs systèmes d’IA.
À lire aussi : Apple à nouveau accusé d’avoir entraîné son IA avec des livres piratés
Meta (Facebook, Instagram, WhatsApp) accusé d’avoir pillé des livres pour son IA en France
Alors que les auteurs « ont passé des années à créer les œuvres en question », les entreprises de l’IA « ont passé quelques secondes à les copier. En intégrant l’expression créative des (auteurs) dans leurs paramètres de modélisation et/ou d’optimisation, les sociétés se sont appropriées — et continuent de monétiser — les fruits du travail protégé par le droit d’auteur des auteurs (…) », regrettent les auteurs de la plainte.
À lire aussi : Salaire divisé par deux, moins de contrats, perte de sens… Les traducteurs percutés de plein fouet par l’IA générative
De nombreuses procédures en cours
Cette action en justice s’ajoute aux nombreuses autres intentées pour violation du droit d’auteur – 70 pour les États-Unis, selon le site AI Watch.dog. Contrairement à d’autres procédures comme celle qui vise Anthropic, les écrivains ont décidé de ne pas se regrouper dans le cadre d’une action collective. Selon ces derniers, ce type de procès favorise les entreprises d’IA au détriment des créateurs, puisqu’il leur permet de négocier en une fois un accord unique, avec de nombreux plaignants.
« Les entreprises LLM ne devraient pas pouvoir éteindre si facilement des milliers et des milliers de réclamations de grande valeur à des tarifs défiant toute concurrence », indique la plainte. Or, les six auteurs écrivent vouloir « conserver le contrôle total de leur affaire et éviter que leurs droits ne soient dilués en se retrouvant entraînés dans des règlements de recours collectifs tentaculaires, structurés de manière à résoudre les réclamations pour quelques centimes seulement ».
À lire aussi : Après l’échec des négociations entre tech et ayants droit, bientôt une nouvelle loi pour protéger les créateurs ?
👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google, et abonnez-vous à notre canal WhatsApp.