Nvidia accusé d’avoir entraîné ses IA sur des livres piratés

Nvidia accusé d’avoir entraîné ses IA sur des livres piratés



Le recours au « fair use » pour entraîner des modèles d’IA est de plus en plus contesté par les ayants droit. Une plainte déposée contre Nvidia aux États-Unis accuse le groupe d’avoir exploité des livres piratés sans autorisation, ce qui relance une fois encore le débat sur les limites de cette exception juridique.

Nvidia pris la main dans le pot à confiture ? Le géant des puces aurait en effet utilisé des contenus protégés par droit d’auteur pour entraîner ses propres modèles IA (comme NeMo, Megatron ou encore Retro). Une plainte en nom collectif déposée aux États-Unis par des auteurs affirme que l’entreprise s’est servi de livres piratés, sans autorisation ni compensation.

L’ombre des bibliothèques pirates

Les plaignants assurent ainsi que Nvidia a exploité Books3, une énorme base de données de livres piratés déjà au cœur de plusieurs actions en justice contre d’autres acteurs de l’IA. La class action contre Nvidia a été amendée pour affirmer, emails internes à l’appui, que le groupe a contacté directement Anna’s Archive, une des plus grandes bibliothèques pirates actives — tout récemment, elle a siphonné la quasi-intégralité de la bibliothèque de Spotify.

Selon des échanges cités dans la plainte, Nvidia aurait envisagé d’acheter un accès « haut débit » à des millions de livres piratés, malgré un avertissement explicite sur l’illégalité des contenus. Anna’s Archive aurait proposé jusqu’à 500 To de données, des ouvrages issus du prêt numérique contrôlé de l’Internet Archive. La plainte évoque aussi l’usage d’autres sources pirates : LibGen, Sci-Hub et Z-Library.

Il n’existe pour le moment aucune preuve que Nvidia a acheté quoi que ce soit à Anna’s Archive, et l’entreprise n’a pas non plus répondu sur le fond aux nouvelles accusations. Les emails internes présentés par les plaignants n’ont pas été validés par une décision judiciaire.

Au dépôt de la plainte, Nvidia s’est défendu en invoquant le « fair use » (usage équitable): les livres ne constituent pour ses modèles IA que des ensembles de données statistiques. Une ligne de défense qui n’a pas mis fin à la procédure, comme on le voit aujourd’hui. Et les nouvelles preuves des plaignants ne sont pas à l’avantage de Nvidia qui donne l’impression d’être prêt à tout pour enrichir ses modèles.

👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google, et abonnez-vous à notre canal WhatsApp.

Source :

TorrentFreak



Source link

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.