Le lancement de ChatGPT fin 2022 a été pour beaucoup une véritable claque. Avec lui, le grand public a véritablement pu prendre conscience de la puissance que pouvait représenter un programme d’intelligence artificielle. Grâce au chatbot d’OpenAI, le monde entier a pu se rendre compte de l’énorme potentiel que peut représenter l’Intelligence artificielle.
Si pour beaucoup ChatGPT a été une véritable claque, il ne représente qu’une infime partie de ce que les IA sont capables de faire. Bien d’autres outils, tout aussi puissants, existent. Et l’un des autres domaines dans lesquels l’IA a fait d’énormes progrès, c’est dans la génération d’images.
Tout comme ChatGPT sait produire un texte à partir de quelques instructions, il existe des programmes capables de créer de toutes pièces des images, à partir d’une simple description textuelle. Pour fonctionner, ces IA ont, comme ChatGPT, été nourries et entraînées grâce à des centaines de milliers de données. Dans ce cas précis, probablement des milliards d’images en tout genre. Au cours des derniers mois, ces IA ont beaucoup évolué et sont capable de produire, dans certains cas, des images d’une telle qualité qu’il est de plus difficile de savoir s’il s’agit d’image réelles ou d’images générées artificiellement. difficilement différenciable devenues tellement douées, qu’elles produisent des images dignes d’artistes hum
Mais leur puissance commence à inquiéter. Certains artistes n’hésitent pas à accuser ces programmes d’Intelligence artificielle de plagiat. Ces IA génératives sont littéralement pointées du doigt, car elles ont été entraînées, dans la plupart des cas, avec des images sans l’autorisation de leurs auteurs respectifs. Pour certains créateurs, ces IA génératives ont tout bonnement piraté des milliards d’œuvres d’art.
Nous en avons passés en revue plusieurs plates-formes d’IA génératives, sélectionnés celles qui peuvent être utilisés gratuitement, et n’avons gardé que les meilleures. Pour tester leurs capacités, nous leur avons soumis, à toutes, les mêmes prompts. Et les résultats obtenus sont la plupart du temps loin de se ressembler. Les voici.
Midjourney, une des références en la matière, proposait il y a encore quelques mois, un essai gratuit. L’offre n’existe plus désormais, et la plate-forme n’est accessible qu’après avoir souscrit à l’un des abonnements proposés.
Proposé par Adobe, l’éditeur de Photoshop, Firefly est un modèle d’intelligence artificielle générative comparable à Midjourney, Dall-E et Stable Diffusion. Directement intégrée à Photoshop, elle est également disponible depuis un site web dédié pour vous permettre de générer à la demande des visuels sortis tout droit de votre imagination. Contrairement à ce que l’on pourrait s’attendre avec Adobe, Firefly est accessible gratuitement, pour tous les utilisateurs.
De par son expertise dans la retouche d’image, Adobe a intégré à sa plate-forme plusieurs outils Comme tous les outils permettant d’ajouter différents effets, de modifier la couleur et le ton de l’image générée, ou encore de jouer sur l’éclairage du rendu. Par ailleurs, vous pourrez ajuster l’ouverture de la focale pour ajuster l’effet de flou d’objectif, agir sur le zoom pour modifier le champ de vision, ou encore ajouter des éléments à exclure de l’image. Il vous faudra toutefois le faire sous la forme de texte, et uniquement en anglais.
Par défaut, Adobe Firefly génère des images au ratio 1:1 (carré), mais vous pourrez tout à fait changer ce rapport d’aspect. La plate-forme en propose quatre différents. Vous pourrez ainsi obtenir des images au format Portrait (3:4), Paysage (4:3) et Grand écran (16:9) en plus du format carré natif. Enfin, si vous n’arrivez pas à l’aide d’un simple prompt à obtenir l’image de vos rêves, vous pourrez toujours soumettre à Adobe Firefly une image de référence pour que les visuels créés correspondent avec son style.
Parmi les modèles d’apprentissage automatique capables de générer des images réalistes à partir d’une description en langage naturel, Stable Diffusion est également en bonne place. Sa principale particularité est que son code source est accessible à tous, Stability AI, son créateur, l’ayant publié sur Github. Il est utilisable directement depuis un navigateur via des applications Web comme celle de Lexica.art qui utilise ce modèle d’IA générative. L’inscription sur le service en ligne est gratuite et vous permet de profiter par défaut d’une centaine de crédits d’utilisation, ce qui correspondant à la génération d’environ 500 images. Ce nombre pourra diminuer en fonction de la taille et du niveau de détails souhaité. Toutes les images que vous créez, ainsi que leurs prompts, sont consignées dans un historique. Leur aperçu n’est toutefois pas conservé sur les serveurs du service, mais uniquement dans le cache de votre navigateur Web. Il faudra donc bien penser à sauvegarder celles qui vous conviennent le plus.
Vous pourrez également exécuter Stable Diffusion localement sur un PC, en utilisant, par exemple, un outil comme Easy Diffusion. En exécutant Stable Diffusion sur votre propre machine, vous pourrez utiliser l’IA de manière illimitée pour générer vos images. Attention toutefois, si vous comptez opter pour cette option, il vous faudra posséder une machine dotée d’une configuration musclée, avec une carte graphique dédiée. La génération d’image avec Stable Diffusion est en effet particulièrement gourmande en ressources.
Depuis quelques semaines, Bing, le moteur de recherche de Microsoft, sait générer des images à partir d’une simple description. Le module dédié à cette pratique, Bing Image Creator, est accessible depuis n’importe quel navigateur Web, en se rendant à cette adresse.
Encore à l’état de Preview, Bing Image Creator devrait à terme être définitivement intégré dans le mode Conversation de Bing. Pour créer son service de création d’image, Microsoft n’est pas allée chercher très loin. La firme de Redmond s’est tout simplement appuyée sur Dall-E, le modèle d’intelligence artificielle générative d’OpenAI, le créateur de ChatGPT sur lequel le mode Conversation de Bing est basé. Si Bing Image Creator est utilisable gratuitement, le service requiert tout de même que vous possédiez un compte Microsoft et que vous le connectiez dans Bing. Une fois cette formalité remplie, vous pourrez commencer à générer des images en saisissant une simple description textuelle dans le champ prévu à cet effet.
À noter tout de même que Microsoft a prévu un système de boosts vous permettant de générer des visuels plus rapidement. Par défaut, vous disposerez dès la première utilisation du service de 25 boosts. Une fois ce crédit épuisé, vous pourrez toujours utiliser Bing Image Creator, mais la génération de vos rendus devrait être plus lente, et peut-être moins efficace. Quid de l’obtention de nouveaux crédits ? C’est là que Microsoft est très maligne. L’entreprise américaine s’appuie sur ses Microsoft Rewards, un système de récompenses avec des points que vous obtenez en utilisant son moteur de recherche Bing et en réalisant certaines actions suggérées par celui-ci.
Enfin, Bing Image Creator étant destiné au grand public, Microsoft a mis en place un certain nombre de garde-fous afin d’empêcher les utilisateurs de s’en servir pour générer des contenus nuisibles. L’outil est donc bridé, tout comme le mode Conversation. Il ne faudra donc pas enfreindre les règles mises en place par Microsoft, sous peine de voir votre compte très rapidement blacklisté de la plate-forme.
Dall-E, le modèle d’intelligence artificielle sur lequel s’appuie Bing Image Creator, a été développé par OpenAI, le créateur de ChatGPT. Comme pour ce dernier, il est possible de tester les capacités de Dall-E directement depuis votre navigateur Web. Seule condition à cela, il vous faut disposer d’un compte OpenAI. Si vous utilisez déjà ChatGPT, vous pouvez utiliser votre compte pour vous connecter à Dall-E, et si ce n’est pas le cas, vous pourrez vous inscrire en cliquant sur le lien Sign Up affiché sous le bouton de connexion depuis la page d’identification permettant d’accéder au service.
Malheureusement, contrairement à ChatGPT qui peut être utilisé gratuitement sans limites, Dall-E restreint le nombre d’images qu’il est possible de générer gratuitement. Par défaut, vous bénéficierez chaque mois de quinze crédits gratuits. Ceux-ci correspondent à quinze requêtes envoyées dans l’outil pour créer des images. Si vous souhaitez utiliser Dall-E au-delà de ce nombre de crédits, il vous faudra passer à la caisse. Comptez une quinzaine de dollars pour l’obtention de 115 crédits. Les crédits gratuits non consommés ne sont pas reportables d’un mois sur l’autre, tandis que ceux que vous achetez sont valables durant douze mois à partir de leur date d’achat.
Toutes les images que vous créez avec Dall-E sont sauvegardées dans un historique auquel vous pouvez accéder sans limites. Chaque requête envoyée au programme vous permet de générer quatre visuels que vous pourrez télécharger individuellement.
Contrairement aux autres solutions citées précédemment, BlueWillowAI n’est pas un modèle d’intelligence artificielle générative à part entière. L’outil a été créé en janvier 2023 par une équipe d’ingénieurs spécialisés en IA qui préfère rester pour l’heure anonyme. Si l’on en croit la FAQ du site, BlueWillowAI se charge en réalité d’agréger plusieurs modèles d’intelligence artificielle. En opérant de cette manière, la plate-forme fait la promesse d’obtenir les meilleurs résultats possibles, en fonction du prompt saisi. Si BlueWillowAI ne détaille pas les modèles d’IA sur lesquels il s’appuie, il indique utiliser des modèles comme celui de Stable Diffusion. Et vu les résultats obtenus, il y a de fortes chances pour que ce modèle soit celui principalement utilisé par l’outil.
Jusqu’à il y a encore peu, BlueWillowAI ne disposait ni d’application, ni de site Web dédié. Pour utiliser l’outil, il fallait impérativement créer un compte Discord, et rejoindre le serveur BlueWillowAI correspondant. Depuis, de l’eau a coulé sous les ponts. En octobre dernier, LimeWire, l’éditeur du célèbre logiciel peer-to-peer qui s’est depuis reconvertie dans les solutions de création de contenus graphique, a fait l’acquisition de BlueWillow.
Un grand chamboulement pour BlueWillow que se retrouve donc propulsé dans une application Web accessible à tous depuis n’importe quel navigateur Web. Attention toutefois, même si BlueWillow peut toujours être utilisé gratuitement, le nombre de génération d’images est à présent limité. L’accès gratuit garanti une dizaine de crédit quotidiens, permettant de générer une vingtaine d’images par jour.
Une fois votre prompt saisi sur l’interface, vous pourrez choisir entre trois formats d’image (carré, portrait ou paysage) et pourrez ajuster l’orientation que prend l’IA, pour qu’elle suive à la lettre votre proposition ou prenne quelques libertés artistiques. Vous pourrez par ailleurs choisir entre trois niveaux de détails pour vos images et pourrez même insérer un « prompt négatif » pour indiquer à l’IA les éléments que vous ne souhaitez pas voir apparaître à l’image.
Créée par des anciens de chez Google, OpenArt est une plate-forme en ligne dédiée à « l’art génératif ». Destinée aussi bien aux artistes qu’aux passionnés d’IA générative, OpenArt ne s’appuie pas sur un modèle d’IA générative particulier, mais sur une multitude de modèles, a priori créés par la communauté d’utilisateurs. Autant dire que vous aurez l’embarras du choix pour générer des images dans différents styles.
Dans sa version gratuite, OpenArt offre une cinquantaine de crédits permettant d’expérimenter toutes les fonctionnalités disponibles. Attention néanmoins, ces crédits ne vous sont donnés qu’une seule fois. Grâce à eux, vous pourrez générer jusqu’à quatre images simultanément sur quatre modèles basiques. Une fois ces 50 crédits épuisés, vous pourrez faire la demande d’une centaine de crédits supplémentaire en rejoignant le serveur discord dédié.
Après avoir saisi votre prompt dans l’interface prévue à cet effet, vous pourrez sélectionner l’un des nombreux modèles disponibles pour le style final de votre image. OpenArt vous permettra d’affiner vos visuels en intégrant les éléments que vous ne souhaitez pas voir dans des prompts négatifs. La plate-forme propose cinq ratios d’image (carré, portrait, paysage, cinéma et tablette), mais vous pourrez toujours ajuster manuellement, si vous le voulez, la taille de vos images. Vous pourrez en outre soumettre une image directement dans l’outil pour que ce dernier s’inspire de son style pour générer vos visuels.
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.
Par : Opera