Google s’enfonce toujours plus profondément dans l’« AI slop » avec le projet Genie, qui permet de créer des mondes en 3D à explorer, le tout à partir d’une simple requête texte. Les résultats impressionnent, mais l’intérêt demeure tout de même très ténu, sans oublier les questions délicates de propriété intellectuelle.
Google ouvre au grand public les portes de Genie 3, un modèle IA dévoilé en août dernier capable de générer des environnements interactifs. D’abord limité à une poignée de testeurs triés sur le volet, le modèle peut maintenant être utilisé par les abonnés Google AI Ultra aux États-Unis, avant une très probable expansion à l’international.
Une prouesse technique, des usages encore flous
Le projet Genie, puisque tel est son nom, permet de générer rapidement des univers en 3D que l’on peut explorer avec le clavier, que ce soit en vue à la première ou à la troisième personne. Les expériences sont limitées dans le temps (pas plus de 60 secondes), la fréquence d’images ne dépasse pas les 24 FPS, la physique peut ne pas être complètement respectée, le contrôle des personnages à l’écran n’est pas assuré, il peut y avoir de la latence…
Le projet Genie n’en demeure pas moins impressionnant : non seulement le modèle crée des mondes cohérents, mais il génère aussi en temps réel les graphismes en fonction des interactions de l’utilisateur — les mouvements de son personnage et les mouvements de la caméra. Et le tout peut être modifié à loisir en changeant le prompt texte… ou en intégrant une photo d’un objet du monde réel (et même un selfie pour le reproduire dans un environnement).
Reste maintenant à savoir à qui s’adresse un tel outil. Google se pose aussi la question ! Diego Rivas, directeur produit chez DeepMind, l’admet chez The Verge : « [Ouvrir le projet Genie] nous permet d’apprendre de nouveaux cas d’usage auxquels nous n’avions pas pensé ». Genie pourrait par exemple servir à visualiser des scènes pour une production audiovisuelle ou pour des contenus éducatifs.
Bref, des usages spécifiques et limités dans leur ampleur : pas question de reproduire des jeux vidéo comme Zelda ou Metroid Prime… même si The Verge a pu produire de telles expériences très facilement. Au vu des capacités de Genie 3, ces infractions à la propriété intellectuelle — Nintendo n’a certainement pas donné son autorisation — risquent de se multiplier. Google veille au grain et restreint les capacités du modèle au fil de l’eau.
La question des droits d’auteur n’est pas pour autant réglée. Le modèle IA du projet Genie a été entraîné à partir de vidéos de sessions de jeux et puisqu’il ne peut pas créer à partir de rien, les séquences générées s’inspirent (voire copient purement et simplement) des jeux existants. Ce n’est pas demain la veille que le prochain blockbuster vidéoludique sortira de l’usine de Genie.
👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google, et abonnez-vous à notre canal WhatsApp.
Source :
Google