Reddit attaque Anthropic en justice pour l’utilisation non consen …

Mercredi, Reddit a déposé une plainte en Californie, affirmant qu’Anthropic, le développeur de Claude, ignore le protocole d’exclusion des robots (REP), ou robots.txt, qui empêche les robots d’exploration d’IA d’extraire le contenu d’un site.

Des études indiquent que d’autres entreprises d’IA recourent également à cette pratique : en mars, le Tow Center de Columbia a découvert que plusieurs chatbots, dont Perplexity, pouvaient encore récupérer des articles d’éditeurs ayant bloqué leurs robots d’exploration via REP.

La plainte affirme qu’« Anthropic est en fait intentionnellement entraîné à utiliser les données personnelles des utilisateurs de Reddit sans jamais demander leur consentement », ce qui constitue une violation de la politique de confidentialité des utilisateurs de Reddit. En juillet 2024, Reddit a publiquement critiqué Anthropic pour avoir utilisé abusivement son contenu.

Des relations complexes

Ce procès est le dernier en date d’un conflit permanent entre les sites qui créent et hébergent du contenu, notamment les éditeurs, les organes de presse et les forums d’utilisateurs comme Reddit, et les entreprises d’IA qui extraient ce contenu pour l’utiliser comme données d’entraînement.

Fin 2023, le New York Times est devenu le premier éditeur à poursuivre OpenAI et Microsoft pour avoir utilisé son contenu pour entraîner ses modèles sans autorisation ni paiement.

En avril, Ziff Davis, la société mère de ZDNET, a poursuivi OpenAI pour violation de droits d’auteur, citant des cas similaires où l’entreprise d’IA a exploré des sites Ziff Davis malgré leur blocage. Des auteurs et des créatifs ont également poursuivi OpenAI et Meta pour des motifs similaires.

Des accords aux débouchés encore incertains

Ce qui distingue Reddit ici, c’est qu’il s’agit également d’une entreprise technologique, contrairement aux éditeurs à l’origine des poursuites judiciaires antérieures. Reddit a conclu des accords de licence avec OpenAI et Google.

D’autres éditeurs, dont Dotdash Meredith, le Financial Times et l’AP, ont adopté une approche différente. Ils ont conclu des accords de licence avec des entreprises d’IA leur permettant d’accéder à tout ou partie de leur contenu en échange d’outils IA internes et de citations préférentielles dans les réponses des chatbots.

Cependant, des études montrent que ces derniers peinent encore à citer avec précision et à privilégier les articles des éditeurs. Ce qui laisse à penser que ces avantages sont encore incertains.

Source link

Des relations complexes

Des accords aux débouchés encore incertains

Laisser un commentaire Annuler la réponse