L’intelligence artificielle (IA) est encore à l’honneur dans cette semaine d’annonces de prix Nobel. Le volet chimie de la promotion, décerné mercredi 9 octobre, récompense, au moins pour moitié, un outil d’intelligence artificielle, qui a révolutionné la vie des biochimistes, AlphaFold. Le Britannique Demis Hassabis (48 ans) et l’Américain John Jumper (39 ans) ont développé ce logiciel au sein de l’entreprise DeepMind, cofondée par le premier, en 2010, et rachetée par Google, en 2014. L’autre moitié du prix va à l’Américain David Baker (62 ans) de l’université de Washington, qui, vingt ans avant ses colauréats, avait abordé, sans intelligence artificielle mais avec de premiers succès, le même sujet.
Ce problème est une sorte de casse-tête, dur à résoudre pour les humains, mais facile pour Dame Nature : comment trouver la forme tridimensionnelle prise par les protéines en ne connaissant que la succession des vingt acides aminés qui les constituent ? Un virus s’accroche à une cellule par des protéines comme la fameuse spike du coronavirus. Le fer est transporté dans le sang par des protéines (l’hémoglobine). Les hormones, les enzymes sont des protéines…
Constituées d’un enfilage de perles, les acides aminés, les protéines ne restent pas en ligne comme un spaghetti, mais se replient, se tordent, forment des hélices, des crochets, des poches… qui leur confèrent finalement leur fonction. Des pathologies, comme la maladie de Creutzfeldt-Jakob, sont même liées à des défauts de repliement de protéines.
Or, l’information dont disposent les chimistes sur elles est souvent une séquence de gènes, codant pour des acides aminés, s’assemblant donc en protéines. Mais cela ne suffit pas à saisir leur fonction ou leur mode d’action. La forme dans l’espace est nécessaire. Et c’est ce problème épineux que l’équipe de DeepMind, une trentaine de personnes, menée par John Jumper, est parvenue à résoudre dans un travail publié en juillet 2021, recourant à plusieurs techniques d’apprentissage automatique par réseaux de neurones artificiels.
« Tout le monde utilise AlphaFold ! »
Quelques mois plus tôt, fin 2020, lors d’un concours mettant aux prises plusieurs équipes pour trouver les structures à partir des séquences, la version 2 d’AlphaFold écrase la concurrence, doublant les performances obtenues jusqu’alors. Puis DeepMind détaille son algorithme, met en ligne son code et annonce sa collaboration avec le Laboratoire européen de biologie moléculaire (EMBL) pour enrichir une base de données, dont les informations avaient servi à la mise au point du logiciel.
Il vous reste 64.34% de cet article à lire. La suite est réservée aux abonnés.