Créateurs : 0. Développeurs d’intelligence artificielle : 1. Dans le combat qui oppose auteurs et artistes aux développeurs d’IA, les entreprises comme OpenAI, Meta, Microsoft, Google et StabilityAI ont encore et toujours un train d’avance. Et ce n’est pas le droit d’auteur qui va venir les ralentir. Depuis des mois, les écrivains, les acteurs, les doubleurs, les artistes et créateurs de contenus n’en finissent pas de publier des tribunes et de solliciter les législateurs. Leur objectif : que les systèmes d’IA cessent de « piller leurs oeuvres » à des fins d’entraînement, à moins d’avoir obtenu une autorisation, moyennant rémunération.
Les systèmes d’IA doivent ingurgiter des milliards de données pour apprendre à générer du texte, des images, du code ou de la musique. Or, il règne une grande opacité sur les bases de données utilisées, ces outils ne faisant pas la différence entre données protégées par le droit d’auteur et données libres de droit. De quoi rendre ces systèmes d’IA capables d’imiter – ou de reproduire – à la perfection, tel artiste, ou de concurrencer voire de remplacer les créateurs, craignent nombre d’entre eux. Mais malgré leurs actions, les choses n’ont pas changé d’un iota.
À lire aussi : Un grand « pillage numérique » : quand l’IA générative défie le droit d’auteur
Les discussions sur une future règlementation vont toujours bon train, sans qu’elles aient encore abouti. Et malgré quelques concessions, les développeurs d’IA répètent qu’ils ne sont pas prêts à mettre les mains à la poche pour rémunérer les auteurs et les artistes…
Dans les petites victoires des créateurs artistes : Hollywood ?
À quelques exceptions près, car les artistes ont obtenu, ces dernières semaines, de petites victoires. Mercredi 8 novembre, on apprenait ainsi que la grève des scénaristes et des acteurs à Hollywood prenait fin. Le comité de négociation des artistes aurait obtenu, aux États-Unis, des « provisions sans précédent pour s’assurer du consentement et de la compensation [des acteurs], afin de protéger nos membres de la menace de l’IA ».
Selon Reuters qui a pu interviewer un des négociateurs de cet accord – le texte n’a pas encore publié à l’heure où nous écrivons ces lignes – les studios de cinéma devront désormais obtenir l’autorisation des acteurs pour utiliser leur image dans des séquences générées par l’intelligence artificielle (IA). Et ils devront payer les artistes interprètes chaque fois que leur double numérique apparaît à l’écran, en vertu de l’accord de travail qui a mis fin à une grève de 118 jours. Des rémunérations minimales ont été fixées pour toute utilisation de leur double numérique, libre aux acteurs de négocier plus. Ces derniers craignaient d’être transformés en personnages numériques que les studios pourraient utiliser « pour le reste de l’éternité ». Les scénaristes redoutaient, de leur côté, d’être remplacés par des IA ou d’être relégués à de la relecture ou de l’édition.
À lire aussi : Cinéma : comment le monde du doublage tente d’endiguer son « pillage » par l’IA
En France, les cinéastes demandent le maintien des obligations de transparence dans l’AI Act
L’inquiétude est aussi vivace en France. Le 8 novembre dernier, lors des rencontres cinématographiques de l’ARP (un groupement de cinéastes) qui avaient lieu au Touquet, le réalisateur Radu Mihaileanu a rappelé, pendant un débat, l’importance de deux articles du Règlement sur l’IA (ou AI Act). Ces derniers, actuellement en discussion en trilogue, permettraient d’offrir davantage de transparence en la matière. L’article 28B contraindrait les développeurs d’IA à faire preuve de transparence sur les données d’entraînements des systèmes, puisque ces derniers seraient tenus de publier un résumé plus ou moins détaillé des données protégées utilisées pour l’entraînement. L’article 52 imposerait, de son côté, que tout contenu généré par l’IA soit bien étiqueté en tant que tel. « Il est essentiel que ces deux articles demeurent » dans la version finale de la future loi, a plaidé l’eurodéputée Laurence Farreng pendant le débat, en référence aux négociations qui ont lieu en ce moment entre le Parlement européen, le Conseil et la Commission européenne.
En attendant que « l’AI Act » soit négocié et adopté – son application est prévue au plus tôt dans deux ans et demi – il y aura bien un temps de latence. Et il faudra, dans un second temps, un deuxième niveau de régulation, a soutenu la parlementaire européenne. Une révision du droit d’auteur pourrait bien être mise sur la table, a suggéré l’un des eurodéputés en charge du texte à nos confrères de Contexte, vendredi 10 novembre. Si les contenus protégés par le droit d’auteur sont utilisés lors de l’entraînement du système, il faudra une rémunération, via un rachat de catalogue, une taxe, ou un autre moyen qui reste à inventer, a plaidé l’eurodéputée Laurence Farreng.
Négocier directement avec les entreprises de l’IA en attendant la règlementation
Dans l’Hexagone, un projet de loi franco-français a été déposé en septembre dernier pour davantage protéger les créateurs de contenus face à l’IA. Car « pourquoi ne pas faire preuve, là aussi, d’exception culturelle », se demande Mathilde Croze, interrogée par 01net.com. Pour l’avocate associée au sein du cabinet Lerins, spécialisée en droit du numérique, « en France, on a quand même été capable, dans le passé, de faire des exceptions culturelles pour essayer de protéger le patrimoine et l’exception culturelle française. Pourquoi est-ce qu’avec l’IA, on ne serait pas dans un domaine dans lequel on serait capable de faire la même chose ? », questionne-t-elle.
Un comité interministériel sur l’IA et un groupe sectoriel spécifique à la culture ont été mis en place par le Gouvernement, pour étudier l’impact de l’IA, notamment sur le secteur culturel. Mais ils ne présenteront que leurs recommandations au Gouvernement que d’ici six mois.
En attendant qu’une réglementation adéquate soit adoptée, que faire ? Pour Mathilde Pavis, experte en droit de propriété intellectuelle qui faisait partie du débat des rencontres de l’ARP, les entreprises comme les artistes doivent renégocier les conventions collectives et les contrats, a-t-elle plaidé. Problème : l’auteur ou le créateur de contenus n’est souvent pas en position de force face aux géants de l’IA. D’où la nécessité d’avoir une réglementation, à l’échelle de l’Europe.
Cette renégociation, c’est justement ce que tente de faire la presse française depuis plusieurs semaines. En août dernier, Reporters sans frontières plaidait pour que les médias empêchent OpenAI, en configurant leur site, « de récolter leurs contenus gratuitement ». « Les médias doivent être rétribués pour leur travail d’intérêt général dont les mastodontes de la tech voudraient tirer profit à bons comptes », ajoutait l’ONG sur X.
Comme nous vous l’expliquions, la directive sur le droit d’auteur de 2019 autorise l’IA à collecter des données sur le Web (ce qu’on appelle l’exception dite du « text and data mining »), mais seulement à des fins de recherche, et non à des fins commerciales, et seulement dans le cas où l’auteur n’a pas utilisé « l’opt-out ». Traduction : seulement s’il a expressément fait valoir que ses contenus ne devaient pas être ingurgités par les crawlers, ces robots explorateurs du Web, l’IA n’a pas le droit d’ingurgiter ses oeuvres. Comment exprimer ce refus d’accès ? Pour l’instant, cette question n’est pas résolue, et c’est tout le problème.
Mais un moyen, recommandé par le Geste, qui regroupe près de 90 éditeurs en ligne, consisterait à intégrer le « TDM Reservation protocol » aux sites en question. Il s’agit d’« un préalable nécessaire à la mise en place de licences dans un cadre négocié », écrivait l’organisme dans un communiqué de septembre. Et cet instrument a été adopté par de nombreux titres de presse, rapportait Mind Media, le 18 octobre dernier.
Premières décisions de justice et plaidoyers des géants de l’IA
Mais hormis ces quelques avancées, le rapport de force est loin de s’inverser. Les géants de l’IA ne semblent pas prêts à mettre la main à la poche et à rémunérer les ayants droit ou les créateurs de contenus protégés par le droit d’auteur. C’est ce que laissent transparaître les commentaires enregistrés par OpenAI, Meta, Microsoft, Adobe, Anthropic, Hugging Face et StabilityAI la semaine dernière aux États-Unis.
Les géants de l’IA ont profité d’une période de consultation du public, qui était organisée par l’office américain du droit d’auteur à propos d’une possible réforme du droit d’auteur, pour défendre longuement leur point de vue.
Si les argumentaires diffèrent, leurs conclusions se rejoignent : selon ces derniers, non, ils ne devraient pas payer de droit d’auteur – exactement comme aujourd’hui. Ce qui ne manquera pas de faire réagir les nombreux créateurs de contenus, vent debout contre ce qu’ils estiment être un pillage de leurs œuvres. Pour le groupe de Mark Zuckerberg, toute « l’industrie américaine de l’IA repose sur l’idée que la loi sur le droit d’auteur (américain, NDLR) n’interdit pas l’utilisation de contenus protégés par le droit d’auteur pour entraîner des modèles d’IA ». Changer cela en « imposant un régime de licence inédit maintenant, bien après les faits, provoquera le chaos. Car les développeurs chercheront à identifier des millions et des millions d’ayants droit, pour un bénéfice très faible, étant donné que toute redevance équitable due serait incroyablement faible à la lumière de l’insignifiance d’une œuvre parmi un ensemble d’entraînement Al », écrit Meta.
La raison : former un système ne serait pas, en soi, une utilisation revenant à une exploitation économique du contenu protégé par le droit d’auteur. Il ne s’agirait pas de reproduire l’œuvre, mais « d’identifier des modèles dans un large corpus de contenu », en vertu du « fair use », une exception au droit d’auteur prévue dans le droit américain – mais qui n’existe pas en Europe et en France.
Même son de cloche chez Google, pour qui entraîner un système d’IA avec des œuvres protégées reviendrait à lire un livre. Pour Anthropic, la loi (américaine) actuelle ne doit pas être changée. D’ailleurs, certaines des entreprises du secteur semblent si sûres d’elles qu’elles n’ont pas hésité à s’engager à rembourser les frais de justice de leurs utilisateurs, s’ils sont attaqués sur le front du droit d’auteur. Après Adobe en juin, Microsoft en septembre, Google, en octobre, a promis dans un billet de blog qu’elle indemniserait ses utilisateurs dans deux cas. « S’il est prouvé que les données utilisées pour entraîner ses IA violent un copyright ou, si une entreprise se retrouve condamnée pour violation de copyright après avoir exploité directement un contenu généré par l’une de ses IA ».
Enfin, les deux premières décisions de justice qui opposent, sur le terrain du droit d’auteur, artistes et auteurs aux géants de l’IA sont tombées. Bien que leurs portées doivent être relativisées, puisqu’elles ont été rendues en fonction du droit d’auteur américain qui est très différent du droit européen/français, elles penchent toutes les deux en faveur des entreprises de l’IA.
Jeudi 19 novembre, un juge américain, qui était saisi par plusieurs écrivains, a estimé que les textes générés par Llama, le système d’IA de Meta, ne violaient pas les droits d’auteur des auteurs, rapportait Reuters. Fin octobre, une autre cour américaine jugeait une autre affaire qui opposait des artistes à Stability AI, Midjourney et DeviantArt. Les trois sociétés étaient accusées d’avoir pioché dans les photos et œuvres, sans autorisation, pour entraîner leurs IA. Le juge a estimé que les poursuites à l’égard de Midjourney et DeviantArt étaient écartées. La raison : aucune preuve n’a été apportée sur une éventuelle utilisation d’oeuvres protégées par le copyright par ces deux sociétés – ces dernières n’avaient pas publié leurs bases de données d’entraînements. Seule Stability avait fait preuve de plus de transparence. Pour cette dernière, l’affaire est toujours en cours.