ChatGPT a donné des idées à Amazon. Désireux de s’imposer dans la course à l’intelligence artificielle, le géant du commerce en ligne ambitionne de rendre Alexa, l’assistant vocal des enceintes Echo, plus intelligent à l’aide de ses modèles de langage.
Face à l’essor de ChatGPT et des IA génératives, les assistants vocaux, comme Alexa, Siri et Google Assistant, paraissent tout à coup bien ringards. Amazon l’a bien compris. D’après les documents internes consultés par Business Insider, Amazon a l’intention d’enrichir Alexa, son assistant en perte de vitesse, en s’appuyant sur l’intelligence artificielle générative. Le géant de l’e-commerce exploiterait les possibilités offertes par ses propres modèles linguistiques. Amazon dispose en effet de plusieurs modèles de langage, entraînés depuis de longues années.
Interrogé par le média, un porte-parole d’Amazon corrobore les ambitions de l’entreprise. Il précise que l’initiative s’appuie sur un modèle intitulé Alexa Teacher Model, déjà en partie exploité par l’assistant depuis quelques années. Néanmoins, d’autres modèles destinés à Alexa sont en préparation :
« Nous construisons également de nouveaux modèles qui sont beaucoup plus grands, beaucoup plus généralisés et capables, ce qui transformera ce qui est déjà le meilleur assistant personnel au monde et le rendra encore plus proactif et conversationnel ».
Notez qu’Andy Jassy, PDG d’Amazon, avait déjà laissé entendre l’arrivée d’une nouvelle version d’Alexa. D’après le successeur de Jeff Bezos, l’IA générative pourrait permettre d’asseoir Alexa comme « le meilleur assistant personnel au monde ».
Les futures nouveautés d’Alexa
Grâce à un nouveau modèle de langage, Alexa sera bientôt capable de générer des contenus à la demande. Selon Amazon, l’assistant va « comprendre les demandes de divertissement complexes, le contexte du contenu et offrir des résultats de recherche plus précis et personnalisés sur la vidéo et l’audio ».
Par exemple, un enfant pourrait demander à l’assistant vocal de lui inventer une histoire. Grâce à la caméra intégrée dans certaines enceintes Echo, comme l’Echo Show, Alexa adapterait le récit en fonction de la peluche dans les bras de l’enfant. Le personnage que représente la peluche sera alors incorporé à l’histoire. En parallèle, l’écran de l’enceinte connectée pourrait afficher des illustrations, générées par IA, liées au récit imaginé par Alexa.
L’assistant intelligent serait aussi en mesure de retrouver le titre d’une série sur base d’informations vagues fournies par son interlocuteur. Si vous cherchez une série en fournissant des données peu précises, et sujettes à interprétation, vous pourriez recevoir des recommandations pertinentes. Alexa pourra par ailleurs mettre en avant le service de streaming qui permet de regarder la série, et proposer à l’utilisateur de s’y abonner.
Amazon se concentre sur les « Alexa LLM Entertainment Use Cases », c’est-à-dire les fonctionnalités liées au divertissement. Le groupe prévoit de concevoir ces nouveautés à l’aide de partenariats stratégiques avec des marques comme Disney, Lego ou HBO, ce qui contribuerait à augmenter les revenus générés par Alexa.
Une Alexa qui « pense »
Néanmoins, Alexa serait aussi capable de faciliter la recherche et la lecture d’actualités. Dopée aux modèles linguistiques, elle pourrait « présenter un résumé personnalisé des faits importants et peut aider les clients à approfondir chaque sujet en récupérant des nouvelles et des informations connexes ».
Actuellement, Alexa se contente de piocher dans une base de données et de mettre en avant des informations trouvées sur la toile. Une fois enrichies par l’IA générative, les conversations avec Alexa seront très différentes. Dans sa note interne, Amazon estime que l’utilisateur doit avoir l’impression « qu’Alexa pense plutôt qu’elle ne récupère des informations dans une base de données ».
En parallèle, Amazon a lancé une suite d’outils reposant sur l’IA générative, Bedrock. Destinée aux entreprises, cette suite embarque plusieurs intelligences artificielles, dont un générateur de textes, similaire à ChatGPT, et un générateur d’images, qui se présente comme une alternative à Dall-E ou Adobe Firefly. Ces outils s’appuient notamment sur Titan, l’un des modèles linguistiques développés par Amazon.
Source :
Business Insider