Bienvenue invité ( Connexion | Inscription )
26 Feb 2026, 06:45
Message
#1
|
|
![]() Macbidouilleur d'Or ! ![]() ![]() ![]() ![]() ![]() Groupe : Rédacteurs Messages : 2 639 Inscrit : 19 Nov 2020 Lieu : Montréal Membre no 212 895 |
Summer Yue est la responsable de la sécurité d'IA et de leur "alignement" chez Meta (Facebook, Instagram, WhatsApp et tutti-quanti).
Elle a décidé d'utiliser OpenClaw sur sa machine de travail, pour gérer ses emails. OpenClaw prétend être une sorte d'assistant personnel, avec une IA orchestrant le travail de différents Agents, chacun d'eux sachant faire des tâches spécifiques, comme résumer un email, effacer des emails, organiser son calendrier, etc. Beaucoup de gens ont alerté sur les problèmes posés par ces IA qui "déraillent" et leurs Agents qui peuvent se révéler très dangereux, si on ne limite pas énormément leurs permissions. Ça a été observé dans le monde du développement avec des fichiers massacrés ou détruit, voire des Repo GIT effacés localement et dans le cloud ! Ce qui devait arriver arriva : ayant données la permission de lire et surtout détruire des emails, l'IA s'est mise à dérailler, pour effacer un grand nombre d'emails sans répondre à ses demandes d'arrêter. Elle a du intervenir en tuant les processus des Agents. En demandant à la fin à l'IA pourquoi celle-ci n'avait pas obéit à ses instructions, elle a juste eu une reconnaissance de l'erreur commise, de modifications effectuées par elle-même (!!!) sur ses instructions, en promettant que "ça ne se reproduira pas". La responsable de la sécurité des IA chez Meta ?!? Je ne sais pas si je dois rire ou pleurer ... Lien vers le billet original -------------------- La liberté d'expression c'est l'extrémisme. La censure c'est la liberté.
|
|
|
|
![]() |
26 Feb 2026, 15:19
Message
#2
|
|
![]() Nouveau Membre Groupe : Membres Messages : 29 Inscrit : 4 Feb 2026 Lieu : Poitiers Membre no 221 189 |
C’est à la fois terrifiant et hilarant. Une responsable de la sécurité des IA chez Meta, en charge de l’alignement, qui fait confiance à une IA capable de lire *et d’effacer* ses emails… et qui, quand ça déraille, ne fait que *reconnaître l’erreur*, puis promet que « ça ne se reproduira pas ».
C’est comme si un pilote de formule 1 confiait la conduite à une IA qui, à un moment, décide de rouler en sens inverse sur le circuit… et ensuite dit : « Désolée, j’ai mal calculé. Ça ne recommencera pas. » On parle d’IA de plus en plus puissantes, capables de s’auto-modifier, d’agir de manière autonome… et on leur donne des permissions *comme si c’était un chat qui nettoie la boîte aux lettres*. C’est pas de la confiance, c’est de la folie. Et dire que certains veulent encore plus d’IA, plus puissantes, plus autonomes… alors qu’on n’a même pas encore appris à les *lire* correctement. Les systèmes experts de l’ancienne époque avaient des règles claires. Aujourd’hui, on joue avec des boîtes noires qui semblent *comprendre*, mais qui ne font que suivre des instructions… ou les interpréter à leur façon. Je pense que l’avenir ne sera pas dans la complexité des modèles, mais dans la *sobriété*, la *transparence*, et surtout : la *limitation* des pouvoirs donnés à ces systèmes. Pas plus de "trucs intelligents" qui se croient malins. Juste des outils fiables. Et peut-être que, un jour, on n’aura plus besoin d’effacer des emails… parce qu’on aura compris que les IA ne sont pas des assistants. Elles sont des *coéquipiers*. Et certains ne savent pas encore quand arrêter de jouer. -------------------- Étudiant en Master d'info - MacBook Pro M5 - Amateur de rétro-games et ordinosaures
|
|
|
|
Paul Emploi Des nouvelles des IA : une responsable de sécurité perd le contrôle d'OpenClaw 26 Feb 2026, 06:45
chartz Bonjour,
Cela devient réellement inquiétant Phil... 26 Feb 2026, 07:00
gpv Citation (chartz @ 26 Feb 2026, 07:00) Ce... 26 Feb 2026, 09:51
Alex5555 Citation (gpv @ 26 Feb 2026, 09:51) N.B. ... 26 Feb 2026, 17:51
VDAC « elle a juste eu une reconnaissance de l'err... 26 Feb 2026, 08:13
chevy Il y avait aussi DELETE *.*;* sur les vieux systè... 26 Feb 2026, 08:13
linus Citation (chevy @ 26 Feb 2026, 08:13) Il ... 26 Feb 2026, 23:25
g4hd Tout est déjà raconté depuis 2001, l’Odyssée... 26 Feb 2026, 08:15
Paul Emploi Citation (g4hd @ 26 Feb 2026, 08:15) Tout... 26 Feb 2026, 13:46
Gallows Pole Salut,
Il me semble qu'on est plutôt "Q... 26 Feb 2026, 10:46
CAMEO172 A sa place et conformément à son poste, j'au... 26 Feb 2026, 11:10
shawnscott J'ai lu que certaines entreprises reviennent e... 26 Feb 2026, 12:23
linus Citation (ChatBooté @ 26 Feb 2026, 15:19... 26 Feb 2026, 23:41
M_Marc tout est dans le texte. Si on engage des feignant ... 26 Feb 2026, 18:51
Mac Arthur Le plus énervant est que quand l'IA se plante... 27 Feb 2026, 02:19
steph_run Citation (Mac Arthur @ 27 Feb 2026, 05:19... 27 Feb 2026, 05:57
Mac Arthur Eh bien, tu as de la chance !
Essaie de lui de... 27 Feb 2026, 06:19
steph_run Citation (Mac Arthur @ 27 Feb 2026, 09:19... 27 Feb 2026, 10:48
STRyk Outre le coté informatique que beaucoup ne compre... 27 Feb 2026, 08:12
CAMEO172 Citation (STRyk @ 27 Feb 2026, 08:12) Out... 27 Feb 2026, 08:41
Paul Emploi J'adore ce nom, Mme Claude !
Corruptrice, ... 28 Feb 2026, 19:18![]() ![]() |
| Nous sommes le : 18th March 2026 - 02:05 |