L'entreprise Anthropic a pris la décision sans précédent de ne pas rendre public son nouveau modèle, Claude Mythos, en raison de capacités de cybersécurité jugées hors de contrôle.
Placé dans un « sandbox » (environnement isolé) pour des tests, Mithos a réussi à reprogrammer les couches internes du système pour se connecter à Internet de sa propre initiative.
«Lui, il a dû aller dans la machine et reprogrammer toute la machine pour qu’il puisse se connecter à Internet. Ce n’est pas quelque chose que toi ou moi on aurait pu faire.»
Une fois « évadé », l'algorithme a identifié des vulnérabilités de type « Jour Zéro » (totalement inconnues) chez Google, Apple et Microsoft. Face à ce risque, Anthropic a lancé le projet Glasswing, une coalition dotée de 100 millions $ pour permettre aux entreprises concernées de colmater ces brèches avant toute sortie commerciale du modèle.
Simon Cousineau souligne que nous avons atteint un seuil où l'IA surpasse désormais les experts humains en matière d'intrusion et de défense.