Pour qu’un chatbot IA puisse donner une information précise et fiable, il faut que les sources avec lesquelles son modèle a été entraîné soit de la meilleure qualité possible. Les entreprises de l’IA sont friandes de ces sources, et il leur arrive assez souvent de ne pas demander la permission pour « emprunter » les articles à haute valeur ajoutée des publications en ligne. Microsoft propose une solution sous la forme d’un « marché de contenus » qui, sur le papier, pourrait générer un certain intérêt de la part des éditeurs.
Il fut une époque où le contrat était clair : les éditeurs de presse publiait leurs articles sur le « web ouvert », et les moteurs de recherche aidaient les internautes à trouver ces contenus. Mais ce modèle a volé en éclat avec l’émergence de l’intelligence artificielle générative, où les réponses sont données directement par un bot, sans que l’utilisateur ait besoin de se rendre sur un site web spécifique. En parallèle, les éditeurs ont mis en place des paywalls pour leurs articles premium.
La tentative d’arbitrage de Microsoft
Les entreprises de l’IA sont souvent accusées de voler le web ouvert sans vergogne ni autorisation, et même de piller des contenus protégés par droit d’auteur, des données indispensables au bon entraînement de leurs modèles. Cela se termine au tribunal ou dans le meilleur des cas avec un accord de licence qui octroie une rémunération aux éditeurs contre un accès à leurs contenus et à leurs précieuses archives.
Microsoft veut jouer les bons samaritains avec l’annonce du Publisher Content Marketplace (PCM), une solution qui ouvre aux modèles IA un accès à grande échelle à des contenus de qualité tout en offrant aux éditeurs « une nouvelle source de revenus ». Ces derniers ont la possibilité de définir les conditions d’utilisation et de licence, ils sont rémunérés en fonction de la valeur générée par leurs articles dont ils conservent la propriété et l’indépendance éditoriale.
De leur côté, les entreprises IA peuvent obtenir plus facilement des contenus sous licence qui vont améliorer leurs modèles. Le PCM est ouvert aux éditeurs de toutes tailles (des gros groupes aux indépendants), il est basé sur le volontariat. Pour mettre en place ce marketplace, Microsoft a travaillé ces derniers mois avec de grands éditeurs américains comme Condé Nast, People Inc., USA Today, ou encore AP. Le groupe souhaite maintenant étendre le programme à de nouveaux partenaires qui peuvent s’enregistrer.
Microsoft n’est pas le premier à proposer quelque chose dans ce domaine. Le secteur de l’édition soutient déjà Really Simple Licensing (RSL), un standard ouvert imaginé pour encadrer l’usage des contenus dans notre nouvelle ère de l’IA. Le RSL intègre directement les conditions de licence dans les sites des éditeurs. Cette approche est plus décentralisée que celle de Microsoft, d’ailleurs on ignore si et comment le PCM peut s’articuler avec le RSL.
👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google, et abonnez-vous à notre canal WhatsApp.
Source :
Microsoft