IBM a récemment dévoilé Granite 3.2, sa dernière version de sa famille de grands modèles de langage (LLM). Cette nouvelle version se concentre sur la fourniture de solutions d’intelligence artificielle (IA) petites, efficaces et pratiques pour les entreprises.
La dernière version, Granite 3.1, est apparue à la fin de l’année 2024. Mais il s’agissait d’une simple mise à jour. Granite 3.2 ajoute des capacités expérimentales de raisonnement avec la technologie de chaîne de pensée (CoT).
Le raisonnement CoT est une technique d’IA qui permet aux LLM de décomposer des problèmes complexes en étapes logiques. Ce processus est censé imiter les processus de raisonnement humains. En théorie, cette approche améliore considérablement la capacité d’un LLM à gérer des tâches nécessitant un raisonnement, un calcul et une prise de décision en plusieurs étapes.
La chaîne de pensée au coeur de l’optimisation
En particulier, le CoT d’IBM utilise un framework Thought Preference Optimization qui contrairement aux approches traditionnelles d’apprentissage par renforcement axées principalement sur les tâches logiques, permet d’améliorer les performances de raisonnement sans sacrifier l’efficacité générale des tâches. Cette approche permet donc d’atténuer les compromis de performance.
Qu’est-ce que cette avancée signifie pour vous et moi ? IBM explique que si vous donnez un prompt à un chatbot IA, un processus appelé « prompt chaining« , vous obtenez une réponse spécifique. Par exemple, à la question « Quelle est la couleur du ciel ? », vous devriez obtenir la réponse « Bleu ».
Toutefois, si vous lui demandez d’expliquer « Pourquoi le ciel est-il bleu ? » à l’aide d’un prompt avec la technologie CoT, l’IA commence par définir ce que signifie « bleu » (une couleur primaire), puis déduit que le ciel apparaît bleu en raison de l’absorption d’autres couleurs par l’atmosphère. Cette réponse démontre la capacité de l’IA à construire un argument logique.
Concurrencer des modèles beaucoup plus grands
La technologie CoT est disponible dans les versions Granite 8B et 2B. Les développeurs peuvent activer ou désactiver le raisonnement par programme. Cette option permet aux entreprises d’optimiser les ressources informatiques en fonction de la complexité de la tâche. Après tout, il arrive que l’on veuille savoir à quoi ressemble le ciel sans avoir besoin de détails scientifiques. Selon IBM, cette approche permet au modèle 8B de rivaliser avec les performances de modèles beaucoup plus grands, tels que Claude 3.5 Sonnet et GPT-4o, pour des tâches de raisonnement mathématique complexes.
IBM a également lancé un nouveau modèle de langage de vision (VLM) de deux milliards de paramètres, spécialement conçu pour les tâches de compréhension de documents. Ce développement n’est pas, comme on pourrait le penser à première vue, une fonction graphique. Le VLM est plutôt destiné à améliorer les capacités de compréhension des documents de Granite. IBM a utilisé son Docling toolkit open-source pour traiter 85 millions de PDF et générer 26 millions de paires de questions-réponses synthétiques afin d’améliorer la capacité du VLM à gérer des flux de travail complexes à forte densité de documents.
Alors que d’autres entreprises spécialisées dans l’IA semblent ignorer les questions de sécurité, IBM considère toujours la sécurité comme une fonction primordiale. Granite Guardian 3.2, le dernier modèle de sécurité de l’IA d’IBM, offre une meilleure détection des risques dans les prompts et les réponses. Cette nouvelle version maintient les performances tout en réduisant la taille du modèle de 30 %. Elle propose également une nouvelle fonction de « confiance verbalisée » pour une évaluation plus nuancée des risques.
Prévoir à deux ans
Les entreprises peuvent également être intéressées par les capacités de prévision de Granite. Les nouveaux modèles TinyTimeMixers (TTM) avec moins de 10 millions de paramètres peuvent effectuer des prévisions à long terme jusqu’à deux ans dans l’avenir. Ces modèles sont utiles pour l’analyse des tendances dans les domaines de la finance, de l’économie et de la gestion de la chaîne d’approvisionnement.
IBM est certainement l’entreprise d’IA la plus ouverte aux logiciels libres. Tous les modèles Granite 3.2 sont disponibles sous licence Apache 2.0 sur Hugging Face. Certains modèles sont disponibles sur des plateformes, notamment IBM WatsonX.ai, Ollama, Replicate et LM Studio. Cette approche ouverte s’inscrit dans la stratégie d’IBM visant à rendre l’IA plus accessible et plus rentable pour les entreprises.
« La prochaine ère de l’IA est celle de l’efficacité, de l’intégration et de l’impact sur le monde réel – où les entreprises peuvent obtenir des résultats sans dépenses excessives en matière de calcul » assure Sriram Raghavan, vice-président de la recherche sur l’IA chez IBM.