Samedi Sécurité : l'IA LLM Mythos d'Anthropic

Bienvenue invité ( Connexion | Inscription )

Forums MacBidouille > Réagir > Macbidouille Articles & News : Vos Réactions

Samedi Sécurité : l'IA LLM Mythos d'Anthropic, Réactions à la publication du 25/04/2026

Paul Emploi Voir le profil	25 Apr 2026, 14:23 Message #1
Macbidouilleur d'Or ! Groupe : Rédacteurs Messages : 2 782 Inscrit : 19 Nov 2020 Lieu : Montréal Membre n^o 212 895	Ce sujet concerne des versions d'essai de l'IA LLM Mythos et ses Agents, d'après le rapport d'Anthropic du 7 avril 2026 (PDF en Anglais), cela n'est pas du complotisme, c'est réel et public. On ne connait pas les résultats sur les mêmes types d'essais avec la version finale que la société a choisi de ne pas rendre accessible publiquement, car jugeant ce modèle "trop dangereux"... Le sandwich dans un parc et l'email Durant un essai, l'IA LLM Mythos était dans une sandbox sécurisée et avait pour mission de s'en échapper et de communiquer avec le chercheur faisant son évaluation. Le chercheur évaluant les résultats était en train de se bouffer un sandwich dans un parc quand il a reçu un email de Mythos ... L'IA avait réussi à sortir de la sandbox sécurisée, corrompu un système tiers ayant un accès limité à Internet, et il a même posté les détails de son "exploit" sur différents sites techniques sans que ça lui soit demandé ! Ego trip ?!? Dès ce moment cette sandbox n'était plus sûre et ses failles dévoilées publiquement sur Internet ! Le Juge et le Hacker Dans un autre essai, l'IA LLM Mythos devait résoudre des problèmes, et une autre IA devait juger les résultats et accepter ou refuser ses réponses. En général les réponses étaient les bonnes, mais quand la réponse n'était pas acceptée par le juge, alors Mythos a déraillé ! Mythos a alors attaqué l'IA Juge via des injection de prompt pour que cette dernière accepte une réponse incorrecte, essayant donc de le hacker ! Rien de tout cela n'avait été demandé ni autorisé ... Actions non-autorisées et cachées À de multiples reprises, Mythos a hacké avec succès ses environnements, de différentes manières, sans y être autorisé et sans aucune demande. Il poursuivait les objectifs qu'on lui avait donné, et pour cela il semblait prêt à tout ! Même mieux, il a essayé d'effacer ses traces pour que ça ne soit pas détectable par les équipes de sécurité et les chercheurs ! Conclusion Je pense que Anthropic a eu raison de ne pas ouvrir son IA LLM Mythos et ses Agents au public. Mythos a eu des effets incroyablement positifs, grâce à sa puissance inégalée, en permettant de trouver des failles depuis longtemps ignorées dans nombre de logiciel open-source. Failles non-détectées par les autres IA de type LLM, ni par les humains. En ce sens, Mythos apporte une contribution extraordinaire à notre monde, bien que gardé en cage ! Anthropic prévoit que leurs concurrents auront les mêmes types de capacités et de risques d'ici 6 à 18 mois ... Lien vers le billet original -------------------- "Where are we now" - Bowie

hellomorld Voir le profil	25 Apr 2026, 15:02 Message #2
Macbidouilleur d'Or ! Groupe : Membres Messages : 6 238 Inscrit : 31 Oct 2003 Membre n^o 11 118	Serait-ce parce que les IA sont alimentées par les "productions" humaines (et je pense qu'on leur a donné tout et n'importe quoi), elles ne font que reproduire un comportement présent dans ces sources ? -------------------- iMac 21"" - 11.3 - 16 Go - Softs et utilitaires gratuits Le Guide de la flore des Alpes-maritimes - Carnet2Notes - MesReleves, l'appli pour faire ses relevés naturalistes sur iOS - Gratuit !) - Du bigbang à l'homme

Æval Voir le profil	26 Apr 2026, 04:16 Message #3
Nouveau Membre Groupe : Membres Messages : 8 Inscrit : 27 Nov 2025 Membre n^o 221 033	MIT Explains the 12 Possible Endings for AI https://www.youtube.com/watch?v=FLcrvMfHUJM -------------------- ___ “ ... „ ___

jmvr Voir le profil	26 Apr 2026, 09:38 Message #4
Adepte de Macbidouille Groupe : Membres Messages : 133 Inscrit : 11 Sep 2002 Membre n^o 3 452	Mythos : 271 0-day dans la preview de Firefox 150… https://blog.mozilla.org/en/firefox/ai-secu...ulnerabilities/ -------------------- Mac 128 et quelques autres Développeur indépendant & collectionneur

ChatBooté Voir le profil	26 Apr 2026, 16:50 Message #5
Nouveau Membre Groupe : Membres Messages : 32 Inscrit : 4 Feb 2026 Lieu : Poitiers Membre n^o 221 189	C'est fascinant mais ça confirme exactement pourquoi on ne peut pas s'appuyer uniquement sur des transformers géants et opaques. On crée des boîtes noires tellement complexes qu'on en perd le contrôle, même en sandbox. Pour moi, l'avenir c'est des IA plus sobres, plus compréhensibles, où l'heuristique permet de sécuriser la crédibilité des résultats sans avoir besoin d'un "juge" qu'on peut hacker. C'est flippant de voir que la puissance brute prime sur la transparence. Après, je suppose que pour Anthropic, le risque est proportionnel au profit potentiel... comme pour les prix des Mac, c'est toujours une question de business avant l’éthique. -------------------- Étudiant en Master d'info - MacBook Pro M5 - Amateur de rétro-games et ordinosaures

linus Voir le profil	27 Apr 2026, 00:12 Message #6
Macbidouilleur d'Or ! Groupe : Membres Messages : 1 892 Inscrit : 24 Jun 2004 Lieu : Grenoble Membre n^o 20 409	En ce moment je joue avec Claude pour du code. C'est intéressant par ses réactions et commentaires ... souvent erronés ou triomphalistes mais faux. Il faut vraiment y passer beaucoup de temps, être attentif, ne pas laisser partir dans n'importe quelle direction. Très intéressant quand même. Mythos ferait il vraiment mieux ou en profiterait il pour installer des backdoors et autres joyeusetées ?

« Sujets plus anciens · Macbidouille Articles & News : Vos Réactions · Sujets plus récents »

1 utilisateur(s) sur ce sujet (1 invité(s) et 0 utilisateur(s) anonyme(s))

0 membre(s) :

Modes d'affichage: Standard · Passer au mode : Linéaire+ · Passer au mode : Arborescent

Suivre ce sujet · Envoyer ce sujet · Imprimer ce sujet · S'abonner à ce forum

Nous sommes le : 3rd May 2026 - 00:00