OpenAI va lancer la troisième génération de Dall-E dans le courant de l’automne. Pour se donner le maximum de chance de creuser l’écart avec la concurrence, le générateur d’images va s’intégrer directement dans ChatGPT.
La concurrence est rude dans le secteur des bots conversationnels, mais ChatGPT a établi l’avance d’OpenAI dans l’intelligence artificielle générative. À tel point que les rivaux se définissent par rapport au bot. Mais l’entreprise californienne a plus de difficulté à s’imposer dans le secteur des générateurs d’images. Des outils comme Stable Diffusion (open source) ou MidJourney ont démontré que les alternatives à Dall-E pouvaient faire aussi bien, voire mieux, que le service d’OpenAI.
Du texte et des images dans ChatGPT
C’est pourquoi la troisième version de Dall-E porte en elle toutes les ambitions de la société (Dall-E 2 a été lancé en avril 2022). Elle devrait ainsi s’en sortir mieux dans des domaines où d’autres outils galèrent toujours, comme les mains ou le texte. Attention, OpenAI ne promet pas la perfection, mais des améliorations sensibles et beaucoup plus de nuances grâce à une meilleure compréhension des requêtes. Mais même avec des « prompts » similaires, Dall-E 3 proposera des images plus détaillées :
La nouveauté principale de Dall-E 3, c’est son intégration dans ChatGPT. Les utilisateurs du bot textuel pourront ainsi obtenir des images à partir de leurs requêtes, qu’ils recevront directement dans le fil de la conversation avec le bot. Dall-E 3 sera en mesure de beaucoup mieux comprendre les prompts plus longs. En plus de refléter correctement les demandes de l’utilisateur, le service produira des images de meilleure qualité.
OpenAI a également travaillé sur le renforcement de la sécurité et la réduction des biais dans l’algorithme. L’entreprise veut aussi rassurer les artistes, qui reprochent à Dall-E et aux générateurs d’images en général de piller leurs œuvres. Cette troisième génération a été conçue pour rejeter les requêtes portant sur la création d’images « dans le style d’artistes vivants ». Et ces derniers auront aussi la possibilité de refuser que certaines de leurs œuvres (ou toutes) soient utilisées pour entraîner les modèles d’OpenAI. Reste à voir comment tout cela va s’articuler concrètement.
Lire Faut-il une taxe pour rémunérer les artistes pillés par l’intelligence artificielle ?
Dall-E 3 sera disponible en octobre pour les abonnés ChatGPT+, puis un peu plus tard cet automne pour le grand public.