Aujourd’hui, on s’intéresse à une initiative d’OpenAI qui pourrait bien redéfinir la manière dont on évalue les modèles d’intelligence artificielle dans les secteurs professionnels.
Il s’agit du programme OpenAI Pioneers.
Des évaluations de modèle pour l’instant trop généralistes
Premier point, OpenAI fait le constat que les évaluations actuelles de la performance des IA sont bien trop généralistes.
Jusqu’ici, chaque lancement de modèle d’IA comme Llama de Meta, ChatGPT d’OpenAI ou Claude d’Anthropic s’accompagne de tests de performance standardisés.
Mais ces tests ne reflètent pas les besoins spécifiques des industries comme la santé, le droit ou la finance.
OpenAI veut donc combler ce vide en créant, avec l’aide des entreprises clientes, des critères d’évaluation sur mesure pour chaque secteur.
Co-construction de benchmarks sectoriels
Vous l’aurez compris, OpenAI ne va pas faire cela tout seul. Le programme Pioneers implique une collaboration directe entre les chercheurs de la société et les entreprises participantes.
Ensemble, ils vont co-construire des benchmarks sectoriels et adapter les modèles d’IA aux besoins métiers. Il s’agit donc d’un double objectif. D’une part instaurer une meilleure confiance du public envers ces systèmes, et aussi affiner la technologie.
Le Reinforcement Fine-Tuning comme outil d’affinage
Et ce travail sur la technologie est le troisième point important. Car le programme va utiliser une technique nommée le Reinforcement Fine-Tuning. Cette technique, abrégée en RFT, permet d’ajuster les modèles en fonction de cas d’usage bien précis.
OpenAI aidera les entreprises à mettre en œuvre cette méthode, puis les accompagnera dans leur déploiement à grande échelle.
En clair, OpenAI veut passer d’une IA généraliste à une IA vraiment utile pour les professionnels, en mettant en place un cadre d’évaluation robuste et adapté à chaque métier.
Le ZD Tech est sur toutes les plateformes de podcast ! Abonnez-vous !