Avec ChatGPT Images 2.0, OpenAI corrige le plus gros défaut de son générateur

Avec ChatGPT Images 2.0, OpenAI corrige le plus gros défaut de son générateur


OpenAI dévoile ChatGPT Images 2.0, une toute nouvelle version de son générateur d’images. Fort d’un nouveau modèle d’IA, le générateur corrige le plus gros défaut de la première version… dans l’espoir d’attirer les graphistes, les créatifs, les créateurs et les équipes marketing.

L’an dernier, OpenAI a frappé fort en levant le voile sur ChatGPT Images, un générateur d’images reposant sur l’IA générative. S’appuyant sur GPT-4o au lieu de Dall-E, l’outil a permis à de nombreux utilisateurs de générer des images créatives, réussies et généralement de qualité. Le générateur a rencontré un succès monstrueux, à tel point qu’OpenAI a été temporairement obligé de brider son utilisation.

Plus d’un an après, la start-up vient d’annoncer une mise à jour majeure de son générateur d’images. Ce mardi 22 avril, OpenAI a en effet dévoilé ChatGPT Images 2.0, qu’il présente comme une nouvelle version du moteur de génération d’images incorporé à ChatGPT. Basée sur le modèle gpt-image-2, cette nouvelle itération se veut plus précise et embarque une panoplie de nouveautés. Pour le PDG Sam Altman, la mise à jour est « un bond en avant considérable ».

À lire aussi : Voici GPT-5.4-Cyber, le ChatGPT programmé pour chasser les failles de sécurité

ChatGPT Images écrit enfin correctement

Tout d’abord, la mise à jour s’attaque à l’un des défauts principaux des générateurs d’images : le texte. Comme on s’en était rendu compte l’an dernier, ChatGPT Images avait du mal à écrire correctement. Les mots apparaissaient déformés, illisibles et les phrases n’avaient parfois pas le moindre sens. Trop souvent, on se retrouvait avec des bouts de texte absurdes et incompréhensibles.

© OpenAI

Le nouveau modèle est capable de restituer des textes longs, lisibles et de les positionner correctement à l’intérieur d’une image. Là où les anciens modèles pataugeaient sur trois mots, Images 2.0 gère des paragraphes entiers intégrés dans des mises en page élaborées. Sur ce point, c’est un véritable bond en avant.

Huit images avec une seule requête

Au-delà du texte, OpenAI a repensé en profondeur la manière dont l’IA produit des images. Désormais, il est possible de générer jusqu’à huit images à partir d’une seule requête. Auparavant, il fallait impérativement générer chaque image séparément, avec une requête dédiée, au risque de se retrouver avec des contenus qui manquaient d’unité.

Avec ChatGPT Images 2.0, OpenAI veut attirer les pros

Sans surprise, la start-up de Sam Altman cherche à séduire les utilisateurs professionnels, son nouveau cœur de cible. Elle vise surtout les équipes marketing ou les créateurs de contenu. Le modèle d’IA est ainsi capable de gérer une large palette de formats, du 3:1 au 1:3, ce qui comprend des bannières web, des slides de présentation, des affiches grand format ou encore des visuels optimisés pour les écrans de téléphones.

Toujours dans l’optique de séduire les pros, OpenAI ajoute que le modèle est dorénavant capable d’analyser une demande complexe avant de produire quoi que ce soit. Lorsqu’un utilisateur soumet une demande, l’IA peut lancer une recherche web pour enrichir sa réponse, puis générer plusieurs visuels distincts adaptés à la demande. Selon OpenAI, on « passe d’une interprétation rapide à quelque chose qui ressemble davantage à une construction délibérée ». 

De cette manière, l’outil s’intègre encore mieux dans le flux de travail d’un utilisateur sur ChatGPT. Parmi les cas d’usage cités par OpenAI, on trouve d’ailleurs énormément de situations purement professionnelles, comme la création de schémas techniques ou la conception d’interfaces.

Un outil pro accessible à tous les internautes

ChatGPT Images 2.0 est accessible dès aujourd’hui à l’ensemble des utilisateurs de ChatGPT, sans frais supplémentaires. Comme on pouvait s’y attendre, certaines fonctions avancées, comme la possibilité que l’IA réfléchisse avant de produire une image, sont réservées aux abonnés payants des offres Plus, Pro, Business et Enterprise. Par ailleurs, le modèle à la base de l’outil, gpt-image-2, est disponible via l’API d’OpenAI. Les développeurs peuvent ainsi l’intégrer directement dans leurs propres applications.

La sortie de ChatGPT Images 2.0 survient sur un marché de plus en plus concurrentiel en matière de génération d’images par l’IA. Google, Adobe, Midjourney et Stability AI se disputent actuellement le marché de la création assistée par l’intelligence artificielle. Sur ce marché en plein essor, ChatGPT va-t-il parvenir à tirer son épingle du jeu et à séduire les professionnels ?

👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google, et abonnez-vous à notre canal WhatsApp.



Source link

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.