Waymo vient de publier un rapport de recherche sur un modèle multimodale de bout en bout pour la conduite autonome, basé sur l’intelligence artificielle de Google, Gemini. Selon la société, il pourra imiter le raisonnement humain, en décomposant les tâches complexes en une série d’étapes logiques.
L’intelligence artificielle a toujours eu un rapport avec la conduite autonome. Mais pour des raisons de sécurité, certaines sociétés, aujourd’hui parmi les plus avancées dans la voiture sans conducteur, ont préféré des modèles plus simples, pour éviter toute hallucination ou situation nouvelle, qui aurait pour effet de tromper la machine basée sur l’IA.
Chez Waymo, la filiale de la maison-mère de Google, l’intelligence artificielle va pourtant bien faire son intégration dans ses voitures autonomes. La société a annoncé qu’elle travaillait avec Gemini, l’IA de Google, pour créer un grand modèle de langage multimodale (MLLM) de bout en bout pour la conduite autonome, capable de générer des « trajectoires futures pour les véhicules autonomes », et prendre les bonnes décisions en fonction des obstacles.
Pour faire simple, l’IA se baserait non pas sur des modules spécifiques pour chaque fonction de conduite, que ce soit pour la cartographie, pour la perception, ou pour la planification, mais un système qui serait plus complet, avec des capacités de raisonnement plus complètes, prêt à évoluer et faire face à des environnements nouveaux. Un système qui serait capable d’imiter le raisonnement humain, en décomposant les tâches complexes en une série d’étapes logiques.
Il sera cela dit toujours à risque d’intégrer une IA dans un système de conduite, face aux problèmes d’hallucinations. Mais l’approche de Waymo montre que la conduite autonome sans IA semble se frotter à des obstacles aussi. Jusqu’à présent, Waymo ne propose ses taxis autonomes que dans certaines zones urbaines, à San Francisco, Los Angeles et Phoenix, en plus de tests à Austin et Mountain View. De quoi comprendre que la conduite autonome de ce niveau demande une bonne cartographie et de longs moins d’entraînement sur place, au préalable.
Face à Tesla, Waymo devra aussi faire un choix au regard des capteurs qui soutiendront le fonctionnement de l’IA Gemini dans ses voitures. Car si Tesla utilise de simples caméras, Waymo utilise des capteurs LiDAR et radar 3D, qui sont bien plus coûteux en matière de calcul, reconnaissait la filiale de Google. Pour faire fonctionner son système de bout en bout, il faudrait donc passer à des caméras plus classiques, et donc, dans un sens, donner raison à la concurrence de l’entreprise d’Elon Musk, et son Robotaxi.
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.