Effrayé par un « effet secondaire » du nouveau Claude, Anthropic prend une décision inédite

Effrayé par un « effet secondaire » du nouveau Claude, Anthropic prend une décision inédite



Après une fuite qui avait déjà mis le monde de la cybersécurité en alerte, Anthropic dévoile Claude Mythos, son IA la plus puissante à ce jour. Capable de repérer des failles critiques et de les exploiter, l’IA a fait peur à son créateur. La start-up a pris une décision inédite à l’échelle de l’industrie pour éviter une catastrophe de sécurité…

Après la fuite géante du mois dernier, Anthropic vient de lever le voile sur Claude Mythos, son modèle d’IA le plus puissant à ce jour. Le modèle présente des capacités inédites en matière de cybersécurité. Comme l’explique la start-up, Mythos est en effet capable de détecter des milliers de failles critiques dans tous les grands systèmes d’exploitation et les navigateurs. Surtout, l’IA est capable de mettre au point des méthodes d’exploitation pour tirer profit de ces vulnérabilités. C’est ce qui le différencie des précédentes itérations de Claude, qui pouvaient déjà débusquer les vulnérabilités de façon efficace. C’est un « point de bascule pour la cybersécurité », estime Anthropic.

Un chasseur de failles hors pair

Anthropic précise que Mythos peut travailler de manière totalement autonome. Sur le benchmark CyberGym, Claude Mythos Preview atteint bien 83,1% contre 66,6% pour Claude Opus 4.6, la précédente version de Claude. Sans intervention humaine, l’IA a d’ailleurs retrouvé une vulnérabilité vieille de 27 ans dans OpenBSD, un système d’exploitation utilisé pour faire tourner des pare-feux critiques, et réputé pour sa sécurité. La nouvelle version de Claude a également détecté un bug vieux de 16 ans dans FFmpeg, une bibliothèque vidéo présente dans des millions d’appareils. La bibliothèque avait pourtant été analysée cinq millions de fois par des outils automatisés avant que Mythos ne se penche sur son cas. Le modèle s’est aussi distingué en combinant plusieurs failles du noyau Linux pour obtenir un contrôle total sur une machine.

« Le saut le plus spectaculaire, ce n’est pas la détection de failles, c’est la capacité à fabriquer des exploits complets de façon autonome », déclare Anthropic.

La société américaine précise que personne n’a programmé Mythos pour effectuer des cyberattaques. Ces capacités offensives ont émergé spontanément, en même temps que le modèle progressait en écriture de code, en raisonnement logique et en autonomie. Anthropic parle d’un « effet secondaire » qui permet à Mythos de surpasser « presque tous les experts humains ». 

À lire aussi : Fuite chez Anthropic – que révèle le code source de Claude ?

Une décision inattendue et inédite

Sur le papier, Claude Mythos représente un véritable cauchemar de cybersécurité. Exploité par des cybercriminels, le modèle pourrait faciliter les cyberattaques et mettre en danger tous les systèmes du monde. Conscient des risques, Anthropic a pris une décision inédite dans l’industrie de l’IA : ne pas rendre Mythos accessible au grand public. Au lieu de déployer le nouveau Claude, la start-up a lancé le « Project Glasswing », une coalition réunissant les plus grands noms de la tech mondiale, dont Amazon, Apple, Broadcom, Cisco, CrowdStrike, Google, Linux Foundation, Microsoft, et NVIDIA.

Le projet doit permettre à ces entreprises d’utiliser Mythos pour trouver et colmater les brèches dans leurs propres systèmes. L’initiative doit permettre aux géants de la technologie d’agir avant que des hackers ne mettent la main sur des outils d’IA aussi puissants que Claude Mythos, ce qui risque d’aboutir à une vague de cyberattaques. Dans cette optique, Anthropic s’engage à hauteur de 100 millions de dollars en crédits d’utilisation pour financer les recherches. La société va aussi verser 4 millions de dollars en dons à des organisations de sécurité open source, dont la Linux Foundation.

« Nous voulons permettre aux défenseurs de commencer à sécuriser les systèmes les plus importants avant que des modèles dotés de capacités similaires ne deviennent largement accessibles », explique Anthropic, ajoutant que « Project Glasswing est une tentative urgente ».

À lire aussi : Vague de désinstallations de ChatGPT, ruée vers Claude – que se passe-t-il ?

Prendre de vitesse les hackers

Pour Anthropic, il faut agir de toute urgence pour prendre de l’avance sur les cybercriminels, d’autant plus que l’IA est déjà massivement exploitée dans le cadre d’opérations malveillantes. Depuis plusieurs mois, des cybercriminels utilisent d’ailleurs déjà des versions moins puissantes de Claude pour mener des attaques. En janvier, un hacker russe a compromis plus de 600 appareils dans 55 pays grâce à des outils d’IA générative, dont Claude. En février, un autre s’en est servi pour s’attaquer à des entités gouvernementales mexicaines. Avec Mythos, le risque est encore plus considérable, admet Anthropic. Le modèle est en effet capable d’identifier et de corriger ses propres erreurs de code de manière autonome, sans la moindre intervention d’un programmeur.

Peu après avoir mis un terme à son partenariat avec l’armée américaine, Anthropic indique avoir engagé des discussions avec les autorités américaines au sujet des capacités offensives et défensives de Mythos. La start-up semble prête à mettre les compétences de Claude à disposition du gouvernement des États-Unis.

👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google, et abonnez-vous à notre canal WhatsApp.





Source link

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.