J’ai essayé le nouveau générateur d’images de ChatGPT, pourquoi i …

J'ai essayé le nouveau générateur d'images de ChatGPT, pourquoi i ...


Prompt : Pouvez-vous générer une image réaliste et colorée d’un chien portant un costume dans la rue dans un rapport 16:9. Capture d’écran par Sabrina Ortiz/ZDNET

OpenAI a lancé la mode de la génération d’image à partir de prompt texte avec son modèle DALL-E.

Mais depuis cette époque glorieuse, l’offre de l’entreprise d’IA a été dépassée par des modèles d’images bien plus performants. Par conséquent, lorsque OpenAI a publié son dernier et meilleur modèle de génération d’images GPT-4o, j’étais sceptique.

Après l’avoir testé, j’ai complètement changé d’avis.

De DALL-E à GPT-40

Lorsque DALL-E a été lancé, il vivait sur son site web autonome. Depuis, il a été transféré sur ChatGPT. Ce transfert présente de nombreux avantages, notamment la possibilité de demander au chatbot IA l’image que vous souhaitez dans l’interface même où vous êtes déjà en train de discuter d’autre chose.

Avec la sortie de la génération d’images GPT-4o, OpenAI a conservé ce format pratique, en remplaçant le générateur d’images par défaut de DALL-E par GPT-4o pour les abonnés payants. Par conséquent, il est très facile de créer de nouvelles images à partir du compte ChatGPT Plus. Tout ce que j’avais à faire, c’était d’entrer le prompt pour ce que je voulais voir, et cela les générait. Les utilisateurs peuvent également y accéder à partir de l’interface Sora.

Attention : vous pouvez toujours générer des images de la même manière si vous êtes un utilisateur gratuit. Cependant, si vous n’êtes pas impressionné, c’est parce que même si au lancement, le modèle a été annoncé pour tous les utilisateurs, y compris les utilisateurs gratuits, le PDG d’OpenAI Sam Altman a annoncé un jour plus tard que le déploiement pour le niveau gratuit serait maintenant « retardé pendant un certain temps ».

Que penser des images

Voici donc le moment que vous attendiez : je vais vous parler de la qualité des images. Après l’insertion du prompt, l’IA produit la génération en moins d’une minute.

Le processus est un peu plus long qu’auparavant, mais les images valent la peine. Elles contiennent beaucoup de détails, de textures, de réalisme et même des textes précis. Au lieu de les décrire, je vais inclure des exemples ci-dessous pour que vous puissiez vous en rendre compte par vous-même.

Prompt : Pouvez-vous générer une image réaliste d’un caméléon, de près, prise comme si elle figurait dans le National Geographic au format 16:9 ?

Sabrina Ortiz/ZDNET via ChatGPT

Prompt : Pouvez-vous générer une image d’un ordinateur portable ouvert sur un bureau qui dit : « Ce modèle est si bon qu’il peut même obtenir un texte et des mains corrects, ce qui est généralement un défi majeur pour les modèles d’IA », avec des mains qui tapent sur un clavier dans un rapport 16:9 ?

chatgpt-laptop-with-hands Sabrina Ortiz/ZDNET via ChatGPT

Prompt: Pouvez-vous générer une photo réaliste d’un gros plan d’une femme dans une foule à Times Square, regardant l’appareil photo et souriant, avec la qualité d’une photo prise avec un reflex numérique ?

chatgpt-woman smiling Sabrina Ortiz/ZDNET via ChatGPT

Comme nous l’avons vu ci-dessus, le générateur d’images fait un excellent travail en respectant la consigne et en fournissant des images réalistes et de haute qualité.

Cependant, lorsqu’on teste un modèle d’IA, l’une des véritables mesures de performance est la comparaison avec les concurrents sur le marché. Pour vous donner un bon indicateur, j’ai essayé les mêmes prompts avec les principaux générateurs d’images d’IA, y compris Midjourney, Imagen 3 de Google, Adobe Firefly. Et oui, GPT-4o est meilleur.

Autres caractéristiques notables

Même si la qualité des images est peut-être l’un des plus grands avantages du modèle, il y en a d’autres. L’un des plus importants est qu’il est présent dans l’interface du chatbot, ce qui permet de modifier facilement les générations à l’aide de simples prompts en langage naturel. De plus, comme le chatbot connaît le contexte de la question que vous venez de lui poser, il peut en tenir compte dans la construction de l’image.

Par exemple, si vous discutez avec lui de l’organisation d’une fête d’anniversaire, vous pouvez lui dire : « Peux-tu maintenant créer une invitation contenant les informations ci-dessus ? » Par exemple, j’ai commencé à discuter avec ChatGPT de l’organisation d’une pendaison de crémaillère, et lorsque je lui ai demandé de créer une invitation, je n’ai pas eu à répéter les informations que j’avais déjà données.

Housewarming Party Invite- ChatGPT Capture d’écran par Sabrina Ortiz/ZDNET

Vous pouvez également télécharger des images de référence et demander à ChatGPT de créer une version différente ou de les utiliser comme éléments d’une nouvelle invitation. Par exemple, vous pouvez saisir un selfie et le faire générer dans un style animé, comme on peut le voir dans le nouveau post X d’Altman.

Toutes ces fonctions de personnalisation en font une offre très intéressante pour les créatifs, qui peuvent également demander un rendu sur fond transparent ou intégrer des guides de style de marque tels que des codes hexadécimaux ou des logos.

À propos d’Altman, j’ai pu générer une image de lui portant un chapeau de fête. J’ai pu le faire parce que le nouveau modèle comporte des garanties beaucoup plus souples, destinées à permettre aux utilisateurs de s’appuyer sur leur liberté de création.

Le billet de blog annonçant le modèle précise qu’il limite ce qui peut être créé lorsque des personnes réelles se trouvent dans le contexte, notamment « des garanties particulièrement solides concernant la nudité et la violence graphique ».

chatgpt-image-sam-altman Sabrina Ortiz/ZDNET via ChatGPT

Je ne peux pas dire s’il existe un cas d’utilisation pratique pour cette fonctionnalité. Et Lorsque j’ai essayé de créer une image de Mickey Mouse, l’application m’a dit qu’elle ne pouvait pas le faire pour des raisons de droits d’auteur.

Alors que penser de GPT-40 ?

Dans l’ensemble, le générateur d’images GPT-4o est une grande réussite par rapport aux modèles DALL-E et peut-être l’un des meilleurs parmi tous ceux que j’ai testés.

Cela vaut-il les 20 dollars par mois ? Si vous êtes simplement intéressé par la génération d’images de haute qualité, il existe encore des versions gratuites que vous pouvez explorer et qui sont vraiment capables, comme Adobe Firefly ou Imagen 3 de Google.

Cela dit, si vous êtes un utilisateur fréquent de ChatGPT, la mise à niveau vers ChatGPT Plus devient nettement plus attrayante. Avec cette mise à niveau, vous aurez accès à toutes les dernières et meilleures fonctionnalités des chatbots d’OpenAI, ainsi qu’à la génération d’images et de vidéos de haute qualité, le tout pour 20 $ par mois. Ce qui n’est pas une mauvaise affaire, surtout si l’on considère les autres offres sur le marché. Par exemple, l’abonnement de Midjourney commence à 10 $ par mois et n’offre que la génération d’images.





Source link

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.