IPB

Bienvenue invité ( Connexion | Inscription )

> Samedi sécurité : les IA LLM "open-source" n'ont rien à voir avec le logiciel Libre ou l'Open-Source, Réactions à la publication du 13/09/2025
Options
Paul Emploi
posté 13 Sep 2025, 22:18
Message #1


Macbidouilleur d'Or !
*****

Groupe : Rédacteurs
Messages : 1 929
Inscrit : 19 Nov 2020
Membre no 212 895




Manque d'imagination par moi, mauvaise exécution par ChatGPT 5

Vous avez du entendre parler des LLM (Grands Modèles de Langage) "open-source", le Français Mistral AI prétend proposer de tels modèles accessibles à tous.
J'utilise Mistral AI pour la petite version Minitel de MacBidouille, pour résumer les sujets, je les soutiens, c'est une entreprise prometteuse, surtout avec l'investissement du mastodonte ASML dans cette société, la valorisant au-dessus de 10 milliards d'Euros. Je suis patriote au sens que lui donne Orwell.

Un logiciel gratuit ou "freeware" est un logiciel d'accès libre, où beaucoup ont le droit de l'utiliser gratos. Mais le code-source est privé. Et il y a dans la licence d'utilisation des restrictions.
Il est quasi-impossible d'en auditer de manière externe la sécurité.

Un logiciel Open-Source est un logiciel d'accès libre, où beaucoup ont le droit de l'utiliser gratos. Le code-source est public ainsi que les moyens de le recompiler/regénérer depuis celui-ci. Mais il y a encore des restrictions d'usage, de modification ou d'intégration dans les licences, un forme de contrôle.
Il est possible d'en auditer la sécurité de manière externe.

Un logiciel Libre est un logiciel d'accès libre, où tous sans exceptions ont le droit de l'utiliser gratos. Le code-source est public ainsi que les moyens de le recompilr/regénérer depuis celui-ci. Il n'y a aucune restriction dans les licences.
Par abus ces licences sont appelées "permissives", elles sont simplement Libres.
La sécurité en est totalement auditable.
Je produis publiquement de tels logiciels, sans copyright en licence MIT modifiée (copyleft).

Beaucoup d'IA LLM "open-source" ont des licences limitantes: ce ne sont donc pas des logiciels Libres d'aucune façon. Pas de modification (fine-tuning ou distillation) avec redistribution publique par exemple.

Aucune IA "open-source" donne accès à ce qui a permis de créer les paramètres/weights de son modèle, empêchant de le reconstruire: il faut les prendre comme elles sont sans savoir ce qu'il y a sous le capot, tant en terme de sécurité directe (génération de code, agents) qu'indirecte (biais, désinformation, abus possible des humains interagissants).

Les LLM IA "open-source" ne sont pas Open-Source, encore moins Libres, leurs biais et problèmes de sécurité (incluant la backdoor que j'avais trouvé dans Qwen 2.5) ne sont pas auditables, sauf indirectement au travers de leurs résultats. Des boîtes noires! Aucune sécurité!
Ce sont au mieux des "freeware" mais qui peuvent aussi contenir du malware...


Allo Houston! On a un problème!

Lien vers le billet original



--------------------
La liberté d'expression c'est l'extrémisme. La censure c'est la liberté.
Go to the top of the page
 
+Quote Post
 
Start new topic
Réponse(s) (1 - 12)
scoch
posté 14 Sep 2025, 11:13
Message #2


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 5 000
Inscrit : 1 Jul 2010
Membre no 156 073



Citation (Paul Emploi @ 13 Sep 2025, 23:18) *
Pas de modification (fine-tuning ou distillation) avec redistribution publique par exemple.

Je suis étonné par ce point. On trouve, par exemple sur Hugging Face, des version fine tunées (sous licence Apache 2) de modèles de Mistral Ai, eux-mêmes sous licence Apache 2.


--------------------
L'homme n'est que poussière... c'est dire l'importance du plumeau ! Alexandre Vialatte
Go to the top of the page
 
+Quote Post
Paul Emploi
posté 14 Sep 2025, 12:04
Message #3


Macbidouilleur d'Or !
*****

Groupe : Rédacteurs
Messages : 1 929
Inscrit : 19 Nov 2020
Membre no 212 895



Citation (scoch @ 14 Sep 2025, 12:13) *
Citation (Paul Emploi @ 13 Sep 2025, 23:18) *
Pas de modification (fine-tuning ou distillation) avec redistribution publique par exemple.

Je suis étonné par ce point. On trouve, par exemple sur Hugging Face, des version fine tunées (sous licence Apache 2) de modèles de Mistral Ai, eux-mêmes sous licence Apache 2.

Ouaip je n'aurais pas du citer Mistral dans ce cas! Je corrige!


--------------------
La liberté d'expression c'est l'extrémisme. La censure c'est la liberté.
Go to the top of the page
 
+Quote Post
g4hd
posté 14 Sep 2025, 15:17
Message #4


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 10 399
Inscrit : 9 Nov 2001
Lieu : Pays d’Aix
Membre no 1 255



Encore un article sorti brut de fonderie IA…
huh.gif
Go to the top of the page
 
+Quote Post
macfredx
posté 14 Sep 2025, 15:21
Message #5


Adepte de Macbidouille
*

Groupe : Membres
Messages : 239
Inscrit : 9 Apr 2004
Lieu : Devant mon Mac bien sûr !
Membre no 17 416



Citation (Paul Emploi @ 13 Sep 2025, 23:18) *
(…)
Allo Houston! On a un problème!


Oui, enfin, pas moi, vu que je me tape des IA génératives comme de mon premier caleçon.


--------------------
iMac alu 21,5" i5 2,7GHz 12Go - Mac OS 10.13.6 (mort, en attente de renouvellement) - MacBook Pro 15" 2018 2,6GHz 16Go - Mac OS 14.5 - iMac G4 15" 800MHz 768 Mo - Mac OS 10.4.11 - FreeBox Révolution - HP Color Laserjet CP1515n - Canon Lide 20 - Minolta Scan Dual IV
Je soutiens le Comité de lutte Contre le langage sms et les fautes volontaires sur Internet
Membre du club des AIPBP (Anciens Inscrits Pas Beaucoup de Posts) Voir la liste
Go to the top of the page
 
+Quote Post
scoch
posté 14 Sep 2025, 15:44
Message #6


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 5 000
Inscrit : 1 Jul 2010
Membre no 156 073



Citation (Paul Emploi @ 14 Sep 2025, 13:04) *
Citation (scoch @ 14 Sep 2025, 12:13) *
Citation (Paul Emploi @ 13 Sep 2025, 23:18) *
Pas de modification (fine-tuning ou distillation) avec redistribution publique par exemple.

Je suis étonné par ce point. On trouve, par exemple sur Hugging Face, des version fine tunées (sous licence Apache 2) de modèles de Mistral Ai, eux-mêmes sous licence Apache 2.

Ouaip je n'aurais pas du citer Mistral dans ce cas! Je corrige!

Tu pourrais mentionner que c'est possible pour les modèles en licence Apache 2.

Citation (g4hd @ 14 Sep 2025, 16:17) *
Encore un article sorti brut de fonderie IA…
huh.gif

C'est-à-dire ? Cet article semble plutôt écrit par un humain.

Ce message a été modifié par scoch - 14 Sep 2025, 15:47.


--------------------
L'homme n'est que poussière... c'est dire l'importance du plumeau ! Alexandre Vialatte
Go to the top of the page
 
+Quote Post
Paul Emploi
posté 14 Sep 2025, 15:56
Message #7


Macbidouilleur d'Or !
*****

Groupe : Rédacteurs
Messages : 1 929
Inscrit : 19 Nov 2020
Membre no 212 895



Citation (scoch @ 14 Sep 2025, 16:44) *
Citation (Paul Emploi @ 14 Sep 2025, 13:04) *
Citation (scoch @ 14 Sep 2025, 12:13) *
Citation (Paul Emploi @ 13 Sep 2025, 23:18) *
Pas de modification (fine-tuning ou distillation) avec redistribution publique par exemple.

Je suis étonné par ce point. On trouve, par exemple sur Hugging Face, des version fine tunées (sous licence Apache 2) de modèles de Mistral Ai, eux-mêmes sous licence Apache 2.

Ouaip je n'aurais pas du citer Mistral dans ce cas! Je corrige!

Tu pourrais mentionner que c'est possible pour les modèles en licence Apache 2.

Ouhla si on fait le tour des centaines de licences possibles, plus personne ne va s'y retrouver.

Surtout qu'en terme de sécurité, celle des IA prétendument "open-source" n'est pas évaluable de manière externe, car justement pas open-source du tout!
Libre d'accès et dans certains cas libres d'usage ou même de modification, mais pas open-source...

Lisez la licence de Qwen 2.5, avec une belle backdoor trouvée par moi: dès que vous faites un procès, vous n'y avez plus accès, d'aucune façon! smile.gif
Vous n'avez pas plus le droit d'exploiter cette IA LLM "open-source" commercialement, si vous dépassez les 100 millions d'utilisateurs mensuels, même si c'est seulement une partie, même insignifiante, du service fourni.
Aucune liberté. \/ c'est du Chinois, dans les différentes acceptations du terme!


--------------------
La liberté d'expression c'est l'extrémisme. La censure c'est la liberté.
Go to the top of the page
 
+Quote Post
g4hd
posté 14 Sep 2025, 17:27
Message #8


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 10 399
Inscrit : 9 Nov 2001
Lieu : Pays d’Aix
Membre no 1 255



Citation (scoch @ 14 Sep 2025, 15:44) *
Citation (g4hd @ 14 Sep 2025, 16:17) *
Encore un article sorti brut de fonderie IA…
huh.gif

C'est-à-dire ? Cet article semble plutôt écrit par un humain.

C'est possible, disons que c'est encore un article clivant à propos d'IA…
et tout à fait incompréhensible pour le lecteur inculte que je suis !
Ce serait écrit en cyrillique ou en chinois : je n'y comprendrais pas moins ni plus !!!
Sorry.


--------------------
 Mac Studio M1max 32 Go 1 To - Sequoia - Eizo 27" + Nec 21" - usage PAO
 MBp14 M2pro 16 Go 1 To - Sequoia - iPhone 15 128 - iWatch10
Go to the top of the page
 
+Quote Post
champi
posté 14 Sep 2025, 20:31
Message #9


Adepte de Macbidouille
*

Groupe : Membres
Messages : 151
Inscrit : 25 Jun 2004
Membre no 20 444



Citation (Paul Emploi @ 13 Sep 2025, 22:18) *
Allo Houston! On a un problème!

Oui, un rédacteur qui écrit des articles qui n'ont aucun sens.
Et ce n'est pas la première fois.
Go to the top of the page
 
+Quote Post
scoch
posté 14 Sep 2025, 21:09
Message #10


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 5 000
Inscrit : 1 Jul 2010
Membre no 156 073



Citation (g4hd @ 14 Sep 2025, 18:27) *
Citation (scoch @ 14 Sep 2025, 15:44) *
Citation (g4hd @ 14 Sep 2025, 16:17) *
Encore un article sorti brut de fonderie IA…
huh.gif

C'est-à-dire ? Cet article semble plutôt écrit par un humain.

C'est possible, disons que c'est encore un article clivant à propos d'IA…
et tout à fait incompréhensible pour le lecteur inculte que je suis !
Ce serait écrit en cyrillique ou en chinois : je n'y comprendrais pas moins ni plus !!!
Sorry.

Je trouve que c'est un sujet qu'il est bienvenu de rappeler.
J'essaie de le rendre plus compréhensible.

C'est un article au sujet du terme open source employé au sujet des modèles d'IA.

Nous avons d'abord un rappel des termes gratuit, open source et libre appliqués aux logiciels qui me semble clair.

Au sujet des modèles d'IA, il est indiqué que dans l'immense majorité des cas, les modèles d'IA ne sont pas des logiciels libres.

Il est aussi rappelé que certains modèles sont présentés comme open source mais avec de nombreuses limitations.

Primo, le jeu de données d'entraînement n'est pas fourni, seul est fourni le modèle pré-entraîné. Le terme open source est donc abusif.

Secundo, les licences sont diverses et les clauses variées.

Une licence comme Apache 2 autorise la modification, l'usage commercial et la redistribution en respectant certaines modalités.
Il est donc possible de personnaliser un modèle d'IA open source notamment en l'« affinant » (fine-tuning) pour l'adapter à un usage particulier, de l'utiliser dans un projet commercial, et de le redistribuer. C'est ce que permettent certains modèles (pas tous) de Mistral AI, par exemple.

Des clauses de licence peuvent interdire la rétro-ingénierie, l'utilisation commerciale ou la redistribution, par exemple.

En bref, dans l'immense majorité des cas, les modèles open source sont en réalité peu ouverts.

Ce message a été modifié par scoch - 14 Sep 2025, 21:10.


--------------------
L'homme n'est que poussière... c'est dire l'importance du plumeau ! Alexandre Vialatte
Go to the top of the page
 
+Quote Post
blueG3
posté 14 Sep 2025, 22:50
Message #11


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 3 826
Inscrit : 20 Nov 2001
Lieu : vitry sur seine (94)
Membre no 1 346



toutes les sociétés privés présentent dès qu’elles le peuvent leur "open source",
on peut citer , Micro$oft , Oracle , Apple , la liste s'allonge au fil du temps.

les société ( privées) qui proposent leur l'accès a leur "IA" prétendent que c'est "open source" , avec toute la liste de restriction qui va avec.
l'exemple le plus parlant étant OpenZFS , qui prétent êztre le plus "open source"
https://openzfs.org/wiki/Main_Page

or si vous allez dans la section Github Copyrigt
https://github.com/openzfs/zfs/blob/master/COPYRIGHT

c'est CDDL , le plus restrictif qu'il soit

c'est "open Source" , comme d'autre dirai c'est "open Bar" , mais tu paye la consommation à la fin




--------------------
Desktop - CPU : AMD Ryzen 3600XT@4,6Ghz - RAM 16 Go - CM: Gigabyte X570-Aorus Pro CG : GeForce GTX 970- Audio: AMD Starship/Matisse HD Manjaro 25.1 xfce (unstable)
AMD Ryzen 9900x + Ram 32Go CM : Gigabyte X870 Elite Wifi 7 Cg : Radeon 9070 XT Gigabyte + Os Linux ( Archlinux )
Go to the top of the page
 
+Quote Post
Laszlo Lebrun
posté 15 Sep 2025, 02:43
Message #12


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 2 793
Inscrit : 1 Nov 2021
Membre no 214 848



Citation (scoch @ 14 Sep 2025, 22:09) *
Primo, le jeu de données d'entraînement n'est pas fourni, seul est fourni le modèle pré-entraîné. Le terme open source est donc abusif.
Je vois ça comme Libre Office par exemple. Le programme proprement dit est bien open source, mais ça ne veut aucunement dire que les textest qu'on écrit avec soient libres de droits.
La valeur d'une IA c'est avant tout les informations injectées dans sa base.
Et on aura de plus en plus deux types d'IA: les IA professionelles hyper chères avec une base solide et curatée et les IA gratos-tout-venant s'alimentant des données glanées sur Internet. Et là cela va bientôt devenir le foutoir complet avec des IA s'alimentant avec des résultats générés par d'autres IA ou même par elle-même et des puissants dictateurs y injectant leurs propagandes...


--------------------
"Les gens douteront toujours de la vérité sur Internet car l'erreur est constamment prêchée autour de nous" Johann Wolfgang von Goethe
MBP 15" 2015 Retina ( Win11, Sequoia), Macbook Air 2015 ( Win11, en voyage), iMac 2015 27" Retina (Win11,Sequoia), MacbookPro 2012 (Linux) pour le piano... pour ne citer que les Macs.
Go to the top of the page
 
+Quote Post
joe75
posté 15 Sep 2025, 08:29
Message #13


Macbidouilleur de vermeil !
****

Groupe : Membres
Messages : 1 449
Inscrit : 12 Jun 2005
Membre no 40 785



Bon grand jour. .je me lance dans la découverte de Gemini et Perplexity Pro.

Je viens de découvrir que sur gemini gratuit il y avait un quota soit au mois soit ojournalier pour la génération d images. Je ne connais pas le nombre mais hier c était moins d une dizaine effectuée par iteration succesive .Ou alors c'est une nouvelle fonctionnalité qui nécessite des jetons.

Du coup j ai activé ce matin Gemini Pro (gratuit pendant 6 mois avec un nouveau Samsung et après 21 €/ mois!)
ainsi que Perplexity Pro( gratuit pendant 1 an et après 21 euros/mois)...
Avec un reminder pour me rappeler de me désabonner avant l'écheance

Ce message a été modifié par joe75 - 15 Sep 2025, 09:13.
Go to the top of the page
 
+Quote Post

Reply to this topicStart new topic
1 utilisateur(s) sur ce sujet (1 invité(s) et 0 utilisateur(s) anonyme(s))
0 membre(s) :

 



Nous sommes le : 19th September 2025 - 05:37