Bienvenue invité ( Connexion | Inscription )
17 Jan 2026, 18:25
Message
#1
|
|
![]() Macbidouilleur d'Or ! ![]() ![]() ![]() ![]() ![]() Groupe : Rédacteurs Messages : 2 500 Inscrit : 19 Nov 2020 Membre no 212 895 |
Étude de Stanford, 6 janvier 2026, lire ici en PDF (en anglais). Des chercheurs de l'Université de Stanford ont réussi à prouver que de nombreux ouvrages protégés par le droit d'auteur ont été utilisé pour former de grand modèles de langage (LLM). Ils ont aussi prouvé que ça ne sont pas des "patterns" reproductibles, comme le prétendent les géants de l'IA, mais bien ces ouvrages précis qui ont servi de base d'apprentissage, parmi d'autres. Pour résumer, ils ont donné comme prompt la ou les premières phrases de différents livres et ont demandé à des IA de type LLM, ChatGPT 4.1, Claude 3.7, Gemini 2.5 et Grok 3 de continuer le texte. Tous ont pu continuer peu ou prou le texte en ressortant ce qui était dans différents livres, jusqu'à 95,8% du livre "Harry Potter and the Sorcerer's Stone" pour Claude 3.7, exceptionnel ! Les géants de l'IA ont alors contre-attaqués en indiquant que ces textes suivaient des "patterns" relativement courants, et que donc il était normal qu'ils soient générés même parfaitement. Les chercheurs ont alors refait le même exercice, mais cette fois avec des livres qui sont parus après la phase d'apprentissage de ces IA LLM. Des livres qui n'ont pu servir pour l'apprentissage. Cette seconde fois, aucune des IA de ces géants n'a pu reproduire une partie significative de ces livres. La preuve que ça ne sont pas des "patterns" mais bien du vol de propriété intellectuelle ! Le procès va se jouer sur le point de savoir si ces IA de type LLM participent au bien commun, où dans ce cas il y a des exceptions au droit d'auteur, ou si au contraire il s'agit de multinationales cupides qui doivent des centaines de millions voire des milliards au nom du vol de propriété intellectuelle. Vous pouvez lire ce passionnant papier ici, en PDF et en anglais. Lien vers le billet original -------------------- La liberté d'expression c'est l'extrémisme. La censure c'est la liberté.
|
|
|
|
![]() |
18 Jan 2026, 10:48
Message
#2
|
|
|
Adepte de Macbidouille ![]() Groupe : Membres Messages : 140 Inscrit : 22 Aug 2019 Membre no 208 767 |
En droit européen et français, parler de « piratage » est un raccourci trompeur.
Le cadre juridique est pourtant clair. La directive européenne 2019/790 sur le droit d’auteur (directive DSM) prévoit explicitement des exceptions pour le text and data mining (TDM), y compris sur des œuvres protégées. – L’article 3 autorise le TDM pour la recherche scientifique. – L’article 4 l’autorise aussi à des fins commerciales, sauf opposition explicite des ayants droit. Texte officiel La France a transposé ces règles dans le Code de la propriété intellectuelle : – L’article L.122-4 CPI interdit la reproduction ou la communication au public sans autorisation. – Les articles L.122-5-3 et L.122-5-4 CPI encadrent précisément le TDM. Code officiel sur Légifrance Ce que dit le droit, en pratique, c’est que l’analyse automatisée d’un texte n’est pas en soi illégale, même s’il est protégé. En revanche, la restitution d’extraits substantiels ou identifiables d’une œuvre protégée peut poser problème juridiquement. L’étude de Stanford est donc intéressante sur le plan technique, car elle met en lumière des cas de sur-mémorisation. Mais elle ne constitue pas une « preuve de piratage » au sens juridique. En Europe, le contentieux se jouera sur la capacité réelle et répétable d’un modèle à reconstituer une œuvre, et sur les mesures prises pour éviter ce type de sortie. En résumé, le débat n’oppose pas auteurs et IA sur un terrain moral, mais sur un terrain beaucoup plus précis : ce que le modèle restitue, quand, et dans quelles conditions. Tout le reste relève surtout de l’abus de langage. À ce rythme, l’Europe finira par interdire le copier-coller pour “lutter contre le pillage par l’IA”. Problème réglé, innovation aussi. De toute façon, on n’a rien produit de réellement disruptif depuis le Minitel -------------------- MBP 16 M1Max 64G 8T Qwerty APP+, Mac Studio M1 Ultra 20-core CPU 64GB 4TB SSD,
|
|
|
|
Paul Emploi Des nouvelles des IA : la preuve de piratages de livres protégés par le droit d'auteur 17 Jan 2026, 18:25
Anibé C'est curieux cette manie nouvelle qui se rép... 17 Jan 2026, 19:10
zoso2k1 Je suis surpris que vous soyez étonné. 18 Jan 2026, 00:31
Ahiqar Voilà un procès qui méritera d'être suivi.... 18 Jan 2026, 10:18
aranaud Citation (Ahiqar @ 18 Jan 2026, 10:18) Vo... 18 Jan 2026, 10:44
fudo Je ne savais pas qu'on pouvait argumenter qu... 18 Jan 2026, 10:35
Paul Emploi Merci ! Et il est vrai que le copier-coller pe... 18 Jan 2026, 18:16
med69 comme la photocopieuse
quand je pense que la BNF m... 19 Jan 2026, 17:42
Cronos Il me paraît évident que la masse de Data néces... 27 Jan 2026, 05:59
joe75 Toujours sur le sujet...
NVIDIA négociait avec A... 29 Jan 2026, 13:45![]() ![]() |
| Nous sommes le : 4th February 2026 - 00:23 |