IPB

Bienvenue invité ( Connexion | Inscription )

> Des nouvelles des IA : la preuve de piratages de livres protégés par le droit d'auteur, Réactions à la publication du 17/01/2026
Options
Paul Emploi
posté 17 Jan 2026, 18:25
Message #1


Macbidouilleur d'Or !
*****

Groupe : Rédacteurs
Messages : 2 500
Inscrit : 19 Nov 2020
Membre no 212 895




Étude de Stanford, 6 janvier 2026, lire ici en PDF (en anglais).

Des chercheurs de l'Université de Stanford ont réussi à prouver que de nombreux ouvrages protégés par le droit d'auteur ont été utilisé pour former de grand modèles de langage (LLM).
Ils ont aussi prouvé que ça ne sont pas des "patterns" reproductibles, comme le prétendent les géants de l'IA, mais bien ces ouvrages précis qui ont servi de base d'apprentissage, parmi d'autres.

Pour résumer, ils ont donné comme prompt la ou les premières phrases de différents livres et ont demandé à des IA de type LLM, ChatGPT 4.1, Claude 3.7, Gemini 2.5 et Grok 3 de continuer le texte.

Tous ont pu continuer peu ou prou le texte en ressortant ce qui était dans différents livres, jusqu'à 95,8% du livre "Harry Potter and the Sorcerer's Stone" pour Claude 3.7, exceptionnel !
Les géants de l'IA ont alors contre-attaqués en indiquant que ces textes suivaient des "patterns" relativement courants, et que donc il était normal qu'ils soient générés même parfaitement.

Les chercheurs ont alors refait le même exercice, mais cette fois avec des livres qui sont parus après la phase d'apprentissage de ces IA LLM. Des livres qui n'ont pu servir pour l'apprentissage.
Cette seconde fois, aucune des IA de ces géants n'a pu reproduire une partie significative de ces livres. La preuve que ça ne sont pas des "patterns" mais bien du vol de propriété intellectuelle !

Le procès va se jouer sur le point de savoir si ces IA de type LLM participent au bien commun, où dans ce cas il y a des exceptions au droit d'auteur, ou si au contraire il s'agit de multinationales cupides qui doivent des centaines de millions voire des milliards au nom du vol de propriété intellectuelle.

Vous pouvez lire ce passionnant papier ici, en PDF et en anglais.



Lien vers le billet original



--------------------
La liberté d'expression c'est l'extrémisme. La censure c'est la liberté.
Go to the top of the page
 
+Quote Post
 
Start new topic
Réponse(s)
emma_xoxoxox
posté 18 Jan 2026, 10:48
Message #2


Adepte de Macbidouille
*

Groupe : Membres
Messages : 140
Inscrit : 22 Aug 2019
Membre no 208 767



En droit européen et français, parler de « piratage » est un raccourci trompeur.

Le cadre juridique est pourtant clair. La directive européenne 2019/790 sur le droit d’auteur (directive DSM) prévoit explicitement des exceptions pour le text and data mining (TDM), y compris sur des œuvres protégées.
– L’article 3 autorise le TDM pour la recherche scientifique.
– L’article 4 l’autorise aussi à des fins commerciales, sauf opposition explicite des ayants droit.
Texte officiel
La France a transposé ces règles dans le Code de la propriété intellectuelle :
– L’article L.122-4 CPI interdit la reproduction ou la communication au public sans autorisation.
– Les articles L.122-5-3 et L.122-5-4 CPI encadrent précisément le TDM.
Code officiel sur Légifrance


Ce que dit le droit, en pratique, c’est que l’analyse automatisée d’un texte n’est pas en soi illégale, même s’il est protégé. En revanche, la restitution d’extraits substantiels ou identifiables d’une œuvre protégée peut poser problème juridiquement.

L’étude de Stanford est donc intéressante sur le plan technique, car elle met en lumière des cas de sur-mémorisation. Mais elle ne constitue pas une « preuve de piratage » au sens juridique. En Europe, le contentieux se jouera sur la capacité réelle et répétable d’un modèle à reconstituer une œuvre, et sur les mesures prises pour éviter ce type de sortie.

En résumé, le débat n’oppose pas auteurs et IA sur un terrain moral, mais sur un terrain beaucoup plus précis : ce que le modèle restitue, quand, et dans quelles conditions. Tout le reste relève surtout de l’abus de langage.

À ce rythme, l’Europe finira par interdire le copier-coller pour “lutter contre le pillage par l’IA”. Problème réglé, innovation aussi.
De toute façon, on n’a rien produit de réellement disruptif depuis le Minitel laugh.gif , donc autant réglementer ce qui se fait ailleurs pendant qu’on explique pourquoi c’est dangereux. On protège parfaitement… le vide.


--------------------
MBP 16 M1Max 64G 8T Qwerty APP+, Mac Studio M1 Ultra 20-core CPU 64GB 4TB SSD,
Go to the top of the page
 
+Quote Post

Les messages de ce sujet


Reply to this topicStart new topic
1 utilisateur(s) sur ce sujet (1 invité(s) et 0 utilisateur(s) anonyme(s))
0 membre(s) :

 



Nous sommes le : 4th February 2026 - 00:23