Pour créer des intelligences artificielles efficaces, il faut des composants électroniques puissants mais aussi de grandes masses de données pour entraîner les modèles d’IA.
Cette masse de données a pu être récupérée de façon sauvage sur le Net sans demander l’accord des parties prenantes et des détenteurs de propriété intellectuelle, ce qui occasionne un certain nombre de procès ou parfois des accords d’accès relevant autant de la monétisation que de l’expérimentation.
Certains tentent de s’accommoder de la situation et négocient des partenariats, d’autres la refusent et lancent des procès. Le contexte peut être différent selon que l’on est éditeur de contenus ou hébergeurs de contenus créés par des utilisateurs.
Reddit fait des affaires à l’orée de son IPO
Pour la plate-forme Reddit, la question ne semble pas s’être posée. Pour rendre sans doute la mariée plus belle avant l’introduction en Bourse attendue au mois de mars 2024, elle a signé un accord permettant à une grande entreprise d’intelligence artificielle, non nommée, d’utiliser les contenus créés par les utilisateurs pour entraîner ses modèles d’IA.
Valeur du contrat : 60 millions de dollars/an avec du contenu créé par des utilisateurs…à qui on ne demande pas leur avis et qui verront donc leurs contenus utilisés pour faire tourner des intelligences artificielles, qu’ils soient d’accord ou non avec le principe.
La même plate-forme qui s’alarmait de l’aspiration de ses contenus pour faire fonctionner les IA au point de modifier ses API ne semble plus y trouver à redire désormais.
Nouvelles formes de monétisation
Le contrat, pas encore officialisé et qui pourrait toujours évoluer en périmètre comme en valeur d’ici l’entrée en Bourse, précise Bloomberg, n’est pas exclusif et Reddit pourrait donc en principe le proposer à d’autres acteurs sur des bases similaires.
Il reste à voir si d’autres plates-formes feront le même choix, les contenus produits par les utilisateurs devenant plus que jamais la matière première des IA et pouvant constituer une nouvelle source de revenus, à moins que le procès concernant le siphonnage des données par les entreprises de l’IA ne modifient la perception et l’approche de l’usage des données.
Certes, la monétisation des données personnelles des utilisateurs des plates-formes fait partie intégrante des modèles économiques de la plupart des acteurs des médias sociaux mais c’est encore un autre niveau qui est atteint ici.
Données personnelles et d’usage pour la publicité, contenus créés pour l’IA…Faudra-t-il que les utilisateurs réclament à leur tour une part du gâteau qu’ils contribuent à alimenter mais dont ils sont peu ou prou exclus ?