IPB

Bienvenue invité ( Connexion | Inscription )

 
Reply to this topicStart new topic
> Des nouvelles des IA : la preuve de piratages de livres protégés par le droit d'auteur, Réactions à la publication du 17/01/2026
Options
Paul Emploi
posté 17 Jan 2026, 18:25
Message #1


Macbidouilleur d'Or !
*****

Groupe : Rédacteurs
Messages : 2 499
Inscrit : 19 Nov 2020
Membre no 212 895




Étude de Stanford, 6 janvier 2026, lire ici en PDF (en anglais).

Des chercheurs de l'Université de Stanford ont réussi à prouver que de nombreux ouvrages protégés par le droit d'auteur ont été utilisé pour former de grand modèles de langage (LLM).
Ils ont aussi prouvé que ça ne sont pas des "patterns" reproductibles, comme le prétendent les géants de l'IA, mais bien ces ouvrages précis qui ont servi de base d'apprentissage, parmi d'autres.

Pour résumer, ils ont donné comme prompt la ou les premières phrases de différents livres et ont demandé à des IA de type LLM, ChatGPT 4.1, Claude 3.7, Gemini 2.5 et Grok 3 de continuer le texte.

Tous ont pu continuer peu ou prou le texte en ressortant ce qui était dans différents livres, jusqu'à 95,8% du livre "Harry Potter and the Sorcerer's Stone" pour Claude 3.7, exceptionnel !
Les géants de l'IA ont alors contre-attaqués en indiquant que ces textes suivaient des "patterns" relativement courants, et que donc il était normal qu'ils soient générés même parfaitement.

Les chercheurs ont alors refait le même exercice, mais cette fois avec des livres qui sont parus après la phase d'apprentissage de ces IA LLM. Des livres qui n'ont pu servir pour l'apprentissage.
Cette seconde fois, aucune des IA de ces géants n'a pu reproduire une partie significative de ces livres. La preuve que ça ne sont pas des "patterns" mais bien du vol de propriété intellectuelle !

Le procès va se jouer sur le point de savoir si ces IA de type LLM participent au bien commun, où dans ce cas il y a des exceptions au droit d'auteur, ou si au contraire il s'agit de multinationales cupides qui doivent des centaines de millions voire des milliards au nom du vol de propriété intellectuelle.

Vous pouvez lire ce passionnant papier ici, en PDF et en anglais.



Lien vers le billet original



--------------------
La liberté d'expression c'est l'extrémisme. La censure c'est la liberté.
Go to the top of the page
 
+Quote Post
Anibé
posté 17 Jan 2026, 19:10
Message #2


Macbidouilleur de vermeil !
****

Groupe : Membres
Messages : 1 387
Inscrit : 14 Jun 2005
Lieu : Saintes (17)
Membre no 40 909



C'est curieux cette manie nouvelle qui se répand de se servir dans la propriété des autres… blink.gif
Ça rappelle pas un peu certains dirigeants ? (pardon pour l'intrusion : pas taper !!!) rolleyes.gif

Ce message a été modifié par Anibé - 17 Jan 2026, 19:11.


--------------------
Pourquoi MacIntosh ? Parce que !!! (depuis 1984)
Actuel : Mac Mini M1 2020 - Ventura 13.7.8 - Puce Apple M1 - Mémoire 8 Go
Mais aussi le toujours fidèle : Mac Mini - 10.6.8 (Snow Léo)
Membre du club des AIPBP (Anciens Inscrits Pas Beaucoup de Posts) Voir la règle d'éligibilité

🇺🇦 «Le fait de pouvoir élire librement ses maîtres ne supprime ni les maîtres ni les esclaves» Herbert Marcuse - L'homme unidimensionnel (1964) 🍉
Go to the top of the page
 
+Quote Post
zoso2k1
posté 18 Jan 2026, 00:31
Message #3


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 2 335
Inscrit : 2 Jul 2001
Membre no 449



Je suis surpris que vous soyez étonné.



--------------------
9600@G4/1000, ATI 7000 Panther et 9.1, 896 Mo, 500 Go IDE, DVD-RW, M-Audio IMac G4/1,25 20" Leopard, 2 Go, 320 Go + 320 Go FW.
i7 3770K@4,5 GHz Mountain Lion 16 Go RAID 0 SSD 2*512 Go, 10 To RAID 5, Nvidia 670 2Go, Blu-ray, Ecran 27" HP 2560*1600
i5 2500K@4 GHz Snow Leopoard, 16 Go, 10 To RAID 5, ATI 5770 1 Go
iPod 5 Go première génération iPod U2 40 Go première génération iPod 40 Go troisième génération

« La théorie, c'est quand on sait tout et que rien ne fonctionne.
La pratique, c'est quand tout fonctionne et que personne ne sait pourquoi.
Ici, nous avons réuni théorie et pratique : Rien ne fonctionne... et personne ne sait pourquoi ! »

Albert Einstein

Le jour où le Mac fonctionnera de la même manière que l'iPhone, je passerai à Windows.
Lionel. Macbidouille. 25 juin 2010.
Go to the top of the page
 
+Quote Post
Ahiqar
posté 18 Jan 2026, 10:18
Message #4


Adepte de Macbidouille
*

Groupe : Membres
Messages : 166
Inscrit : 21 Jul 2007
Lieu : Rennes
Membre no 91 072



Voilà un procès qui méritera d'être suivi.

Perso, je vois un vol de propriété intellectuelle.


--------------------
Mac Studio M4 max, écran AGON Pro AG276UZD, macOS Tahoe 26.2
Imac 27 modèle 2020 puce T2 MacOs Séquoia 15.5;
iPad Air 5e iPadOs 26.2;
Membre du club des AIPBP (Anciens Inscrits Pas Beaucoup de Posts) Voir la liste
Go to the top of the page
 
+Quote Post
fudo
posté 18 Jan 2026, 10:35
Message #5


Macbidouilleur de vermeil !
****

Groupe : Membres
Messages : 835
Inscrit : 1 Oct 2004
Membre no 24 498



Je ne savais pas qu'on pouvait argumenter qu'on peut s'affranchir des lois pour le bien commun (déjà ça reste à prouver)
On peut transposer cela aussi pour l'individu (plutôt que la collectivité) car je vois plus facilement le cas où pour le bien d'un individu on peut faire des choses que la personne ne souhaite pas pour autant : ce serait de l'aliénation ! Peut-on priver les gens de leurs prérogatives... je veux dire dans une démocratie évidemment ?


--------------------
Hackintosh 2 (config Fanless with GPU) : Streacom DB4 / Corsair SF600 / Asus Z370-i / i7-8700T / WiFi & BT carte Apple + adaptateur M.2-PCIe / MSI RX560 / SSD 512Go M.2 NVMe x2 (multiboot)
Macbook Air M1
Go to the top of the page
 
+Quote Post
aranaud
posté 18 Jan 2026, 10:44
Message #6


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 4 928
Inscrit : 6 Oct 2003
Membre no 10 144



Citation (Ahiqar @ 18 Jan 2026, 10:18) *
Voilà un procès qui méritera d'être suivi.

Avec des juges IA ?

Les IA ne sont que des outils un peu moins basique qu'un moteur de recherche. Elles ne peuvent rien inventer. Cette euphorie autour des IA me surprend. Entour cas, elles sont bien pratiques pour inonder d'information souvent fausse sur internet ou dans tout autre média. Mais bon, vu le pognons que sa doit rapporter à une minorité. Aucune raison de ne pas transgresser la loi et/ou la morale. Grok me semble l'exemple le plus visible du moment bien que se ne soit pas une nouveauté et déjà présent dans les années 2000. En fait, la manipulation des images et récits remontent depuis la nuit des temps (peinture, photo,...). Juste que les IA donnent cette possibilité à tous le monde sans la moindre connaissance pour un résultat convaincant au premier abord. Avant, s'était "artisanal" alors que maintenant, c'est industrielle.


--------------------
Hackintosh cru 2013 i7 3,5 GHz, Gigabyte Z87X-UD5H, 32 Go, Radeon RX 580, Sonoma, opencore (1.0.1) Si bios briqué --- Mac Mini M4 Pro 48Go, Sequoia
MacBook Pro cru 2012 15" 2.6GHz, HD Antireflet, 16 Go, Sonoma avec OCLP (2.0.2) --- Mac Mini cru 2012 2,5 GHz, 4 Go, High Sierra --- iPad Air (4ᵉ génération).
Go to the top of the page
 
+Quote Post
emma_xoxoxox
posté 18 Jan 2026, 10:48
Message #7


Adepte de Macbidouille
*

Groupe : Membres
Messages : 140
Inscrit : 22 Aug 2019
Membre no 208 767



En droit européen et français, parler de « piratage » est un raccourci trompeur.

Le cadre juridique est pourtant clair. La directive européenne 2019/790 sur le droit d’auteur (directive DSM) prévoit explicitement des exceptions pour le text and data mining (TDM), y compris sur des œuvres protégées.
– L’article 3 autorise le TDM pour la recherche scientifique.
– L’article 4 l’autorise aussi à des fins commerciales, sauf opposition explicite des ayants droit.
Texte officiel
La France a transposé ces règles dans le Code de la propriété intellectuelle :
– L’article L.122-4 CPI interdit la reproduction ou la communication au public sans autorisation.
– Les articles L.122-5-3 et L.122-5-4 CPI encadrent précisément le TDM.
Code officiel sur Légifrance


Ce que dit le droit, en pratique, c’est que l’analyse automatisée d’un texte n’est pas en soi illégale, même s’il est protégé. En revanche, la restitution d’extraits substantiels ou identifiables d’une œuvre protégée peut poser problème juridiquement.

L’étude de Stanford est donc intéressante sur le plan technique, car elle met en lumière des cas de sur-mémorisation. Mais elle ne constitue pas une « preuve de piratage » au sens juridique. En Europe, le contentieux se jouera sur la capacité réelle et répétable d’un modèle à reconstituer une œuvre, et sur les mesures prises pour éviter ce type de sortie.

En résumé, le débat n’oppose pas auteurs et IA sur un terrain moral, mais sur un terrain beaucoup plus précis : ce que le modèle restitue, quand, et dans quelles conditions. Tout le reste relève surtout de l’abus de langage.

À ce rythme, l’Europe finira par interdire le copier-coller pour “lutter contre le pillage par l’IA”. Problème réglé, innovation aussi.
De toute façon, on n’a rien produit de réellement disruptif depuis le Minitel laugh.gif , donc autant réglementer ce qui se fait ailleurs pendant qu’on explique pourquoi c’est dangereux. On protège parfaitement… le vide.


--------------------
MBP 16 M1Max 64G 8T Qwerty APP+, Mac Studio M1 Ultra 20-core CPU 64GB 4TB SSD,
Go to the top of the page
 
+Quote Post
Paul Emploi
posté 18 Jan 2026, 18:16
Message #8


Macbidouilleur d'Or !
*****

Groupe : Rédacteurs
Messages : 2 499
Inscrit : 19 Nov 2020
Membre no 212 895



Merci ! Et il est vrai que le copier-coller peut être utilisé pour abuser du droit d'auteur... wink.gif


--------------------
La liberté d'expression c'est l'extrémisme. La censure c'est la liberté.
Go to the top of the page
 
+Quote Post
med69
posté 19 Jan 2026, 17:42
Message #9


Macbidouilleur d'argent !
***

Groupe : Membres
Messages : 775
Inscrit : 14 Jan 2005
Lieu : lyon
Membre no 30 785



comme la photocopieuse
quand je pense que la BNF mets en ligne sa collection (c'est bien pour le savoir commun) et dépense pour cela beaucoup d'argent (le notre). ensuite les entreprises de l'IA pillent généreusement (à but lucratif) ce patrimoine.
avec la puissance de l'IA rapidement la plupart des contenus disponibles auront été générés artificiellement.
donc l'IA récupéra un ersatz de connaissance qui servira à générer de la soupe qui sera ensuite récupérée pour générer de la bouillie. ça c'est disruptif.
Go to the top of the page
 
+Quote Post
Cronos
posté 27 Jan 2026, 05:59
Message #10


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 2 496
Inscrit : 14 Jan 2005
Lieu : Paca
Membre no 30 750



Il me paraît évident que la masse de Data nécessaire pour avoir une IA performante exige forcément le piratage de toutes les informations disponibles sur internet ou ailleurs.
A suivre aussi ci dessous l'article du Figaro (à confirmer) l'orientation prise par chatGPT une IA américaine:
" L’outil d’intelligence artificielle développé par OpenAI se réfèrerait à des informations issues de l’encyclopédie d’Elon Musk, concurrente de Wikipédia et dont la fiabilité est contestée.
La dernière version de ChatGPT , développée par OpenAI, citerait l’encyclopédie d’Elon Musk Grokipedia, selon une information du média The Guardian. En réponse à plus d’une douzaine de questions, en lien avec des sujets de géopolitique internationale, posées par le journal britannique, GPT-5.2 aurait ainsi cité Grokipedia à neuf reprises. De quoi soulever des inquiétudes quant à la fiabilité de l’information, puisque l’intelligence artificielle (IA) puise ainsi dans une autre IA, dont la fiabilité est largement contestée."
L'impérialisme américain continue à se développer et s'insinue dorénavant dans la tête des utilisateurs peu regardant......
J'espère que Le Chat de Mistral Français et que j'utilise en priorité restera responsable de ses réponses...


--------------------
iMac/ mi 2013(écan crâmé mars 2023); Mac mini/ début 2011, iPad mini /2012 (HS), Mac mini puce M1/fin 2020 avec SSD500 Go et 8Go de RAM ; TourPC en kit (juin 2020): carte mère TUF B450-Plus Gaming , AMD ryzen 5 3600x , 32 Go RAM DDR4, SSD 500 Go crucial, HD 2To seagate , carte Wi-Fi 6 + Bluetooth et carte graphique Nvidia GeForce RTX 3080 Ti-Tel mobile Samsung Galaxy A71.
Mettons en commun ce que nous avons de meilleur et enrichissons nous de nos mutuelles différences PAUL VALERY
Go to the top of the page
 
+Quote Post
joe75
posté 29 Jan 2026, 13:45
Message #11


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 1 506
Inscrit : 12 Jun 2005
Membre no 40 785



Toujours sur le sujet...

NVIDIA négociait avec Anna's Archive pour entraîner ses IA... et les emails ont fuité | Posts | Le site de Korben https://share.google/EbwoMAEFqhz9PvfJf
Go to the top of the page
 
+Quote Post

Reply to this topicStart new topic
1 utilisateur(s) sur ce sujet (1 invité(s) et 0 utilisateur(s) anonyme(s))
0 membre(s) :

 



Nous sommes le : 3rd February 2026 - 22:48