Un chercheur vient d’apporter la technologie de la vidéoconférence dans l’un des endroits les plus reculés de la planète : l’épave du HMS Titanic, qui repose dans les fonds marins, à 4 000 mètres sous la surface.
« C’est comme si nous pouvions désormais réaliser des vidéoconférences depuis les abysses », explique Alex Waibel, chercheur à l’université Carnegie Mellon et au Karlsruhe Institute of Technology.
Ca y est, vous comprenez le risque ?
Les signaux radio ne fonctionnent pas bien sous l’eau
Alex Waibel est un expert de la technologie de conversion du texte en parole. A l’heure actuelle, la seule façon pour les chercheurs qui explorent l’épave du Titanic – ou d’autres épaves logées en eaux profondes – à bord de submersibles pour communiquer avec la surface, est d’envoyer des messages textuels par sonar.
Car les signaux radio ne fonctionnent pas bien sous l’eau. Ce qui pose un problème de communication pour lequel les scientifiques ont trouvé des solutions depuis la Seconde Guerre mondiale.
Au cours d’une récente expédition d’OceanGate Expeditions, Alex Waibel a raconté sa plongée et utilisé pour ce faire une technologie de reconnaissance vocale pour convertir ce qu’il disait en messages transmissibles. A la surface, la technologie mise au point par le chercheur et son équipe a ensuite resynthétisé les messages textuels bruts en vidéo grâce à l’intelligence artificielle.
Vers un cas d’usage grand public
Le résultat est une vidéo en temps quasi réel qui utilise la voix d’Alex Waibel. Ses lèvres bougeant en synchronisation avec les mots. Ces efforts visent à faciliter la communication naturelle dans des environnements extrêmes, mais pourraient également avoir un potentiel pour le grand public. Le chercheur, chargé de recherche chez Zoom, conseille la société en matière de recherche sur l’IA et de développement de technologies linguistiques.
« En interprétant et en recréant la communication vocale naturelle, nous essayons de réduire la charge de travail des scientifiques et des pilotes dans de telles missions de manière naturelle, malgré les défis imposés par l’eau, le stress opérationnel, le dialogue conversationnel et les mauvaises conditions acoustiques », a déclaré Alex Waibel à Aaron Aupperlee de la CMU.
Le marché de la reconnaissance vocale entre de manière plus générale dans une phase accélérée de développement et d’adoption dans un certain nombre de secteurs clés. Les travaux d’Alex Waibel s’appuient sur cette tendance avec un mécanisme de diffusion qui utilise des diffusions à faible bande passante (dans ce cas par le sonar) pour fournir une vidéo complète, bien que synthétisée, à l’utilisateur final.
La technologie utilise une voix synthétisée qui ressemble à celle du locuteur, en s’appuyant sur les progrès de la technologie de synthèse vocale alimentée par l’IA. Une autre application potentielle de cette technologie est la traduction rapide d’une langue à une autre, où l’utilisateur final voit une vidéo dans une langue compréhensible que le locuteur ne connaît pas.
Source : ZDNet.com
(function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0]; if (d.getElementById(id)) return; js = d.createElement(s); js.id = id; js.src = "//connect.facebook.net/fr_FR/all.js#appId=243265768935&xfbml=1"; fjs.parentNode.insertBefore(js, fjs); }(document, 'script', 'facebook-jssdk'));