Aux États-Unis, la marque à la pomme fait l’objet d’une nouvelle procédure collective, un mois après avoir été attaquée en justice pour des raisons similaires par des auteurs. Cette fois, la marque à la pomme est accusée d’utiliser les e-books qu’elle vend sur sa propre application (Apple Books) pour entraîner ses outils d’intelligence artificielle.
Les modèles d’intelligence artificielle (IA) d’Apple sont à nouveau la cible d’une « class action » aux États-Unis, pour violation de droits d’auteur. En septembre dernier, des écrivains avaient formé une première procédure collective pour demander des dommages et intérêts à la marque à la pomme, accusée d’avoir entraîné ses modèles IA à l’aide d’un corpus de 20 000 livres piratés. Le 10 octobre dernier, un recours similaire a été déposé par deux professeurs de l’université Suny Downstate Health Sciences à New York, rapporte Bloomberg. Mais cette fois, la procédure met directement en cause Apple Books, l’appli de la firme américaine qui permet de lire ou d’écouter des livres.
Les deux neuroscientifiques, Susana Martinez-Conde et Stephen Macknik, estiment qu’Apple a bien utilisé leurs « œuvres sans autorisation ». Apple aurait, selon ces derniers, entraîné ses modèles d’IA sur des livres piratés et protégés par le copyright, dont les leurs : de quoi constituer une violation du droit d’auteur, selon la loi américaine. Dans le détail, leurs ouvrages, ainsi que de nombreux autres, se seraient retrouvés dans des « bibliothèques fantômes » ou captés par des « logiciels d’indexation », ces robots qui explorent le Web et qui ingurgitent sans autorisation des contenus à des fins d’entraînement d’IA.
À lire aussi : Il suffit de 250 contenus malveillants pour empoisonner une IA
Nous vous avons autorisé à vendre nos livres sur Apple Book, mais pas à les piller pour entraîner vos IA
Mais surtout, la firme américaine est accusée d’utiliser les e-books, vendus sur sa propre application de livres (Apple Books), comme des données d’entraînements. Dans leur recours, les scientifiques disent en substance : nous vous avons autorisé à vendre nos livres, mais pas à les piller pour entraîner vos IA. Des copies d’e-book auraient en effet été utilisées par Apple sans autorisation pour entraîner son outil d’IA Apple Intelligence, selon les deux professeurs.
À lire aussi : Scanner des livres pour entraîner son IA : c’est légal aux États-Unis, selon cette décision de justice inédite
Enfin, les neuroscientifiques soutiennent qu’Apple continuerait « de conserver des données d’entraînement pour l’IA, y compris des livres piratés », afin d’entraîner de futurs modèles, toujours sans autorisation et rémunération des détenteurs de droit. Ces derniers ciblent en particulier le modèle OpenELM d’Apple, l’un des modèles composant Apple Intelligence.
À lire aussi : « Ni aujourd’hui, ni demain » : Batman et Superman mettent un énorme coup de poing à l’IA
Apple n’est pas la seule société à faire l’objet de poursuites judiciaires, de la part d’auteurs ou d’ayants droit s’estimant spoilés. OpenAI a été poursuivi par le New York Times. La start-up d’IA Anthropic, qui a développé l’outil conversationnel Claude a, de son côté, accepté de verser 1,5 milliard de dollars à 500 000 auteurs qui s’étaient regroupés dans un recours collectif pour utilisation illicite de leurs œuvres – mais l’accord doit encore recevoir le feu vert du juge américain.
À lire aussi : Droit d’auteur : l’accord à 1,5 milliard de dollars d’Anthropic retoqué par le juge
En France et en Europe aussi, les métiers de la création (auteurs, musiciens, maisons d’édition, de disques, comédiens, comédiens de voix, presse) ont initié diverses actions en justice avec le même objectif : faire cesser les entraînements futurs d’IA sans autorisation, et obtenir des dommages et intérêts pour les utilisations de leurs œuvres jugées illicites.
À lire aussi : Meta (Facebook, Instagram, WhatsApp) accusé d’avoir pillé des livres pour son IA en France
Depuis le lancement de ChatGPT en novembre 2022, marquant le début de la vague d’IA générative, les entreprises de l’IA estiment être en droit de se servir sur le Web de toutes les données possibles pour former leur modèle de langage, en vertu du « fair use » aux États-Unis – une exception au droit d’auteur – ou du droit de fouille (data mining) en Europe. De leur côté, les écrivains et éditeurs soutiennent qu’il s’agit d’une violation de leurs droits d’auteur – et d’un « pillage » de leurs contenus. Des actions en justice sont en cours pour trancher la question.
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.