Boris Zhitkov/Getty Images
La croissance de l’IA générative (gen AI) est stimulée par de grands modèles de langage (LLM) très médiatisés, tels que GPT-4o d’Open AI, Gemini de Google et Claude d’Anthropic.
Cependant, alors que ces grands modèles font la une des journaux, un autre type de modèles gagne du terrain. Certains experts estiment que les petits modèles de langage (SLM ou Small Language Model) pourraient être l’avenir de l’IA générique.
Selon le cabinet d’études Gartner, alors que les LLM ont dominé jusqu’à maintenant le développement des modèles de langage, les SLM proposent des solutions aux principaux défis identifiés par les DSI, notamment lorsqu’il s’agit des contraintes budgétaires, de la protection des données, des préoccupations en matière de vie privée et d’atténuation des risques associés à l’IA. Les chefs d’entreprise pourraient donc avoir à choisir entre des modèles plus grands et plus petits à mesure qu’ils explorent l’IA générique.
Lequel des deux gagnera la bataille ? Cinq cadres nous donnent leur avis.
1. Envisager des opportunités spécifiques à un domaine
Claire Thompson, responsable des données chez L&G, explique s’attendre à ce que les modèles de petite et de grande taille aient leur place dans le business. Cependant, elle pense également que les modèles les plus connus aujourd’hui pourraient être adaptés à de nouveaux cas d’utilisation.
« Certains LLM pourraient commencer à être formés sur des sujets spécifiques afin d’en tirer davantage. Et je vois que cela commence à se produire de plus en plus », a-t-elle déclaré.
Bien qu’il reste encore beaucoup à faire pour obtenir des modèles spécifiques à des domaines précis, Mme Thompson dit que de nombreuses entreprises consacrent peu de ressources RH et financières au développement en interne.
« Je ne sais pas si les entreprises construisent leurs propres modèles », a-t-elle ajouté. « Lorsque je parle de créer des modèles, il s’agit plutôt d’exploiter les modèles existants en interne et d’utiliser vos données dans un environnement sécurisé pour obtenir des résultats. »
Toutefois, qu’ils soient petits ou grands, Mme Thompson estime que l’avenir est aux modèles spécifiques. « Vous pourriez adapter un modèle aux informations médicales, aux sujets climatiques et ESG (critères environnementaux, sociaux et gouvernance), et aux marchés d’actifs. Ce sont ces cas d’utilisation spécifiques qui pourraient donner naissance à des modèles plus personnalisés’ dit-elle.
2. Choisir le bon cheval
Nick Woods, DSI du groupe MAG Airports, explique que l’avenir de l’IA générative est probablement un mélange de grands et de petits modèles. « Je ne pense pas qu’il s’agisse d’un modèle unique, dit-il, et le modèle que vous choisissez dépend du cas d’utilisation dans votre entreprise ».
M. Woods affirme entendre des professionnels dire que l’entreprise devrait mettre en place un programme d’IA. Sa réponse ? « Non, c’est la dernière chose à faire ».
Selon M. Woods, les dirigeants devraient se concentrer sur le programme de transformation de l’entreprise et décider quels outils, y compris l’IA générative, peuvent contribuer à produire les bons résultats. « Je pourrais exécuter un petit modèle spécifique en mode Edge Computing pour résoudre un cas d’utilisation particulier, comme par exemple repérer quand une passerelle d’avion est déployée », dit-il.
En bref, selon M. Woods, choisir un modèle, c’est choisir le bon cheval.
« Nous verrons de nombreux petits modèles déployés à grande échelle en mode Edge Computing pour des cas d’utilisation particuliers », a-t-il déclaré. « C’est presque inévitable. Cependant, je continue de penser que certains grands modèles s’imposeront. »
3. Tenir compte du contexte
Gabriela Vogel, analyste du Gartner, dit que ses conversations avec les DSI suggèrent que les petits modèles spécifiques à un domaine ont un rôle important à jouer, du moins à court terme.
« Les clients essaient de trouver et de créer des modèles appliqués à un contexte spécifique », dit-elle. « Il ne s’agit pas nécessairement de grands modèles généraux, mais de modèles spécifiquement liés à de petites bases de données pour une application particulière. »
Gabriela Vogel dit aussi que de plus en plus d’entreprises passent de l’exploration à la production en utilisant des services d’IA à l’aide de SLM.
« Beaucoup ont testé les SML dit-elle, elles ont vu ce qui fonctionne et ce qui ne fonctionne pas avec des modèles plus importants. Elles essaient d’être plus spécifiques et d’appliquer cette approche. »
4. Réduire les hallucinations
Ollie Wildeman, responsable de la satisfaction des clients chez Big Bus Tours, explique que le choix entre SLM et LLM dépend du cas d’utilisation. Mais pour de nombreuses entreprises il est probable que le choix se portera sur une solution plus petite plutôt que plus grande.
Il explique à ZDNET comment Big Bus Tours utilise Freshworks Customer Service Suite, un logiciel d’assistance omnicanal qui comprend des chatbots et une billetterie alimentés par l’IA. L’entreprise utilise également un assistant virtuel doté d’IA de Satisfi Labs qui se connecte à son site web et répond aux questions de base des clients.
« Cette technologie d’IA ne prend en compte que les données des entreprises où elle est intégrée « , précise-t-il. « La technologie de l’entreprise n’est pas connectée à des IA à grande échelle, comme ChatGPT ou d’autres outils. »
M. Wildeman dit que cette approche limitée présente des avantages. Les dirigeants peuvent être sûrs que leurs données sont utilisées avec soin pour produire des résultats. « De cette manière, vos données sont plus sûres car vous savez d’où elles viennent et quels sont les processus utilisés », dit-il. « De plus, vous avez moins d’hallucinations car vous savez que le modèle que vous utilisez est conçu pour le type d’activité que vous exercez. »
Ces résultats amènent Wildeman à conclure que les modèles plus petits et spécifiques à un domaine seront importants pour les entreprises. « Pour les entreprises, le choix du modèle sera plus spécifique, alors que pour l’utilisateur général, ces modèles massifs et gratuits que l’on voit partout seront probablement plus utilisés. »
5. Concentrez-vous sur vos données de première main
Rahul Todkar, responsable des données et de l’IA chez Tripadvisor, dit que le bon modèle pour une entreprise pourrait ne pas être uniquement une question de taille.
Les professionnels peuvent essayer les deux modèles. Cependant, Todkar dit que les modèles personnalisés sont l’avenir de l’IA, qu’ils soient grands ou petits.
« Prenez l’exemple de Mistral 7B, qui est un modèle relativement petit, mais qui donne des résultats fantastiques lorsqu’il s’agit de tâches spécifiques », dit-il. « Pour moi, l’avenir est donc aux modèles personnalisables. »
Selon Rahul Todkar, la clé du succès de l’IA est de s’assurer que le modèle utilise vos données de manière sûre et efficace. « Ce n’est pas la taille du champ d’entraînement ou les caractéristiques du modèle qui importent. Mais plutôt le fait de prendre ce modèle et de l’appliquer dans votre contexte avec vos données de première main. C’est à ce moment-là que vous allez au-delà des modèles standard et que vous pouvez utiliser les informations provenant de vos données. »
Source : « ZDNet.com »