C’est un aveu rare. Presque un anachronisme à l’heure où l’IA s’immisce dans tous les aspects de la création. Suite au lancement réussi de son shooter en octobre, le studio suédois Embark a décidé de corriger le tir. Face au mécontentement d’une partie de sa communauté, qui jugeait le doublage robotique et nuisible à l’immersion, l’entreprise a choisi de retourner en studio d’enregistrement. Patrick Söderlund, patron de la société, a confirmé avoir fait réenregistrer « certaines » lignes de dialogues par des comédiens en chair et en os, principalement pour des éléments comme le système de « ping » en jeu.
Pourquoi ce rétropédalage sur les voix IA ?
C’est avant tout une question de qualité. C’est Patrick Söderlund lui-même qui met les pieds dans le plat. « Il y a une différence de qualité. Un vrai acteur professionnel est meilleur que l’IA ; c’est comme ça », a-t-il déclaré. Cette décision pointe une réalité souvent occultée dans le discours pro-technologie : l’efficacité ne peut pas être le seul curseur. Pour le jeu Arc Raiders, qui a connu un immense succès sur Steam, ce grain de sable dans la machine nuisait à l’expérience globale.
La pilule ne passait pas auprès des joueurs. Malgré le succès critique et commercial, l’utilisation de la synthèse vocale pour des dialogues, même secondaires, a été perçue comme une coupe budgétaire au détriment de l’art. Le geste d’Embark est donc fortement symbolique. Il prouve que la pression de la communauté peut encore infléchir les stratégies de production et que, pour l’instant, l’âme d’une performance vocale ne se génère pas aussi facilement qu’une ligne de code.
L’intelligence artificielle est-elle totalement bannie du studio ?
Absolument pas. Le studio se garde bien de jeter le bébé avec l’eau du bain. Söderlund précise que l’Intelligence artificielle reste un « outil de production » avant tout. L’idée n’est pas de remplacer les humains, mais d’accélérer certaines phases du développement. Par exemple, l’équipe peut tester en interne une quinzaine de dialogues différents via la technologie text-to-speech (synthèse vocale à partir de texte) pour valider leur pertinence avant de convoquer un acteur en studio.
Le modèle économique est aussi clarifié : Embark assure payer ses acteurs pour le temps passé en cabine, mais aussi pour l’obtention d’une licence d’utilisation de leur voix par le système de synthèse vocale. C’est une approche hybride et pragmatique. Le studio n’abandonne donc pas la technologie, mais il la relègue à un rôle de maquettage ou de production pour les éléments les moins cruciaux, reconnaissant tacitement que l’expérience prime sur l’économie pour les aspects les plus visibles du jeu.
Quelle est la vraie place de l’IA dans l’industrie du jeu vidéo ?
Le cas d’Arc Raiders est fascinant car il va à contre-courant du discours ambiant. Alors que Junghun Lee, le PDG de Nexon (l’éditeur du jeu), affirmait que tous les studios utilisaient désormais l’IA, la démarche d’Embark sonne comme un bémol. Elle montre que l’intégration de ces outils n’est ni simple, ni universellement acceptée. Le débat sur le doublage par IA est loin d’être clos.
Cette affaire soulève la question fondamentale de la valeur perçue. Les joueurs sont-ils prêts à accepter une baisse de qualité, même minime, au nom de la rentabilité ou de la rapidité de production ? Pour Embark, la réponse est clairement non. Le studio a choisi de réinvestir pour peaufiner son produit post-lancement, un signal fort envoyé à une industrie qui cherche encore le bon équilibre entre innovation technologique et artisanat créatif.
Foire Aux Questions (FAQ)
Toutes les voix IA d’Arc Raiders ont-elles été supprimées ?
Non, le studio a confirmé avoir remplacé « certaines » lignes de dialogues, mais pas la totalité. L’IA text-to-speech est toujours utilisée, notamment pour des éléments jugés moins essentiels à l’immersion, et comme outil de production interne.
Les acteurs ont-ils été payés pour l’utilisation de leur voix par l’IA ?
Oui. Le PDG d’Embark Studios, Patrick Söderlund, a précisé que les comédiens sont rémunérés pour leur temps en studio d’enregistrement, mais aussi spécifiquement pour l’octroi d’une licence permettant au studio d’utiliser leur voix via son système de synthèse vocale.
Cette décision signifie-t-elle la fin de l’IA dans le doublage de jeux vidéo ?
Il est trop tôt pour le dire. Ce cas représente plutôt un avertissement pour l’industrie : la qualité et la perception des joueurs restent des facteurs cruciaux. L’IA continuera probablement d’être utilisée, mais les studios devront être plus stratégiques sur son application pour ne pas dégrader l’expérience finale.

