IPB

Bienvenue invité ( Connexion | Inscription )

> Des nouvelles des IA : une responsable de sécurité perd le contrôle d'OpenClaw, Réactions à la publication du 26/02/2026
Options
Paul Emploi
posté 26 Feb 2026, 06:45
Message #1


Macbidouilleur d'Or !
*****

Groupe : Rédacteurs
Messages : 2 639
Inscrit : 19 Nov 2020
Lieu : Montréal
Membre no 212 895



Summer Yue est la responsable de la sécurité d'IA et de leur "alignement" chez Meta (Facebook, Instagram, WhatsApp et tutti-quanti).
Elle a décidé d'utiliser OpenClaw sur sa machine de travail, pour gérer ses emails.

OpenClaw prétend être une sorte d'assistant personnel, avec une IA orchestrant le travail de différents Agents, chacun d'eux sachant faire des tâches spécifiques, comme résumer un email, effacer des emails, organiser son calendrier, etc.

Beaucoup de gens ont alerté sur les problèmes posés par ces IA qui "déraillent" et leurs Agents qui peuvent se révéler très dangereux, si on ne limite pas énormément leurs permissions.
Ça a été observé dans le monde du développement avec des fichiers massacrés ou détruit, voire des Repo GIT effacés localement et dans le cloud !

Ce qui devait arriver arriva : ayant données la permission de lire et surtout détruire des emails, l'IA s'est mise à dérailler, pour effacer un grand nombre d'emails sans répondre à ses demandes d'arrêter. Elle a du intervenir en tuant les processus des Agents.


En demandant à la fin à l'IA pourquoi celle-ci n'avait pas obéit à ses instructions, elle a juste eu une reconnaissance de l'erreur commise, de modifications effectuées par elle-même (!!!) sur ses instructions, en promettant que "ça ne se reproduira pas".

La responsable de la sécurité des IA chez Meta ?!?
Je ne sais pas si je dois rire ou pleurer ...

Lien vers le billet original



--------------------
La liberté d'expression c'est l'extrémisme. La censure c'est la liberté.
Go to the top of the page
 
+Quote Post

Les messages de ce sujet
- Paul Emploi   Des nouvelles des IA : une responsable de sécurité perd le contrôle d'OpenClaw   26 Feb 2026, 06:45
- - chartz   Bonjour, Cela devient réellement inquiétant Phil...   26 Feb 2026, 07:00
|- - gpv   Citation (chartz @ 26 Feb 2026, 07:00) Ce...   26 Feb 2026, 09:51
|- - Alex5555   Citation (gpv @ 26 Feb 2026, 09:51) N.B. ...   26 Feb 2026, 17:51
- - VDAC   « elle a juste eu une reconnaissance de l'err...   26 Feb 2026, 08:13
- - chevy   Il y avait aussi DELETE *.*;* sur les vieux systè...   26 Feb 2026, 08:13
|- - linus   Citation (chevy @ 26 Feb 2026, 08:13) Il ...   26 Feb 2026, 23:25
- - g4hd   Tout est déjà raconté depuis 2001, l’Odyssée...   26 Feb 2026, 08:15
|- - Paul Emploi   Citation (g4hd @ 26 Feb 2026, 08:15) Tout...   26 Feb 2026, 13:46
- - Gallows Pole   Salut, Il me semble qu'on est plutôt "Q...   26 Feb 2026, 10:46
- - CAMEO172   A sa place et conformément à son poste, j'au...   26 Feb 2026, 11:10
- - shawnscott   J'ai lu que certaines entreprises reviennent e...   26 Feb 2026, 12:23
- - ChatBooté   C’est à la fois terrifiant et hilarant. Une res...   26 Feb 2026, 15:19
|- - linus   Citation (ChatBooté @ 26 Feb 2026, 15:19...   26 Feb 2026, 23:41
- - M_Marc   tout est dans le texte. Si on engage des feignant ...   26 Feb 2026, 18:51
- - Mac Arthur   Le plus énervant est que quand l'IA se plante...   27 Feb 2026, 02:19
|- - steph_run   Citation (Mac Arthur @ 27 Feb 2026, 05:19...   27 Feb 2026, 05:57
- - Mac Arthur   Eh bien, tu as de la chance ! Essaie de lui de...   27 Feb 2026, 06:19
|- - steph_run   Citation (Mac Arthur @ 27 Feb 2026, 09:19...   27 Feb 2026, 10:48
- - STRyk   Outre le coté informatique que beaucoup ne compre...   27 Feb 2026, 08:12
|- - CAMEO172   Citation (STRyk @ 27 Feb 2026, 08:12) Out...   27 Feb 2026, 08:41
- - Paul Emploi   J'adore ce nom, Mme Claude ! Corruptrice, ...   28 Feb 2026, 19:18


Reply to this topicStart new topic
1 utilisateur(s) sur ce sujet (1 invité(s) et 0 utilisateur(s) anonyme(s))
0 membre(s) :

 



Nous sommes le : 18th March 2026 - 02:09