IPB

Bienvenue invité ( Connexion | Inscription )

 
Reply to this topicStart new topic
> Récupérer les données d'un PDF
Options
swamp
posté 13 Apr 2025, 17:48
Message #1


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 1 540
Inscrit : 7 Feb 2005
Lieu : Il est 5 h... Paris s'éveille...
Membre no 32 590



Bonjour,

J'ai récupéré un PDF avec des dizaines d'illustrations intégrées dans le fichier, mais sans légende ou non de fichier. Le boulot consiste à retrouver le fichier original stocké sur un DD, donc boulot fastidieux et surtout une grosse perte de temps.

La question : Existe-t'il un moyen de récupérer des données du fichier PDF avec le nom de chaque illustration ?


--------------------
Pour le café c'est bouilloire et cafetière à piston.
Go to the top of the page
 
+Quote Post
Satioustre1996
posté 16 Apr 2025, 18:23
Message #2


Nouveau Membre


Groupe : Banned
Messages : 1
Inscrit : 16 Apr 2025
Membre no 220 451



Citation (swamp @ 13 Apr 2025, 18:48) *
Bonjour,

J'ai récupéré un PDF avec des dizaines d'illustrations intégrées dans le fichier, mais sans légende ou non de fichier. Le boulot consiste à retrouver le fichier original stocké sur un DD, donc boulot fastidieux et surtout une grosse perte de temps.

La question : Existe-t'il un moyen de récupérer des données du fichier PDF avec le nom de chaque illustration ?


Vérifiez si le fichier PDF a le nom d'origine enregistré ?

[moderators fighting spam]

Ce message a été modifié par Phil J. Fry - 7 May 2025, 12:52.
Raison de l'édition : spam enlevé
Go to the top of the page
 
+Quote Post
magicPDF
posté 16 Apr 2025, 22:09
Message #3


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 2 088
Inscrit : 22 Apr 2008
Lieu : 43.93 N / 4.84 E
Membre no 112 856



Citation (swamp @ 13 Apr 2025, 17:48) *
La question : Existe-t'il un moyen de récupérer des données du fichier PDF avec le nom de chaque illustration ?


Bonjour

Pas à ma connaissance car ces infos ne sont intégrées dans les PDF. Par-contre je crois qu'il existe des logiciels capables de rechercher "par image".


--------------------
Acrobate du PDF, InDesigner, Photoshopographe et WordPresseur
abracadabraPDF.net
Go to the top of the page
 
+Quote Post
swamp
posté 18 Apr 2025, 08:08
Message #4


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 1 540
Inscrit : 7 Feb 2005
Lieu : Il est 5 h... Paris s'éveille...
Membre no 32 590



Citation (Satioustre1996 @ 16 Apr 2025, 18:23) *
Citation (swamp @ 13 Apr 2025, 18:48) *
Bonjour,

J'ai récupéré un PDF avec des dizaines d'illustrations intégrées dans le fichier, mais sans légende ou non de fichier. Le boulot consiste à retrouver le fichier original stocké sur un DD, donc boulot fastidieux et surtout une grosse perte de temps.

La question : Existe-t'il un moyen de récupérer des données du fichier PDF avec le nom de chaque illustration ?


Vérifiez si le fichier PDF a le nom d'origine enregistré ?


C'est à dire ?


--------------------
Pour le café c'est bouilloire et cafetière à piston.
Go to the top of the page
 
+Quote Post
swamp
posté 18 Apr 2025, 09:00
Message #5


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 1 540
Inscrit : 7 Feb 2005
Lieu : Il est 5 h... Paris s'éveille...
Membre no 32 590



Citation (magicPDF @ 16 Apr 2025, 22:09) *
Citation (swamp @ 13 Apr 2025, 17:48) *
La question : Existe-t'il un moyen de récupérer des données du fichier PDF avec le nom de chaque illustration ?


Bonjour

Pas à ma connaissance car ces infos ne sont intégrées dans les PDF. Par-contre je crois qu'il existe des logiciels capables de rechercher "par image".


OK !


--------------------
Pour le café c'est bouilloire et cafetière à piston.
Go to the top of the page
 
+Quote Post
NABLABLA
posté 18 Apr 2025, 10:35
Message #6


Macbidouilleur de vermeil !
****

Groupe : Membres
Messages : 1 109
Inscrit : 18 Oct 2005
Lieu : 35-Bretagne
Membre no 48 141



Citation (magicPDF @ 16 Apr 2025, 23:09) *
Bonjour

Pas à ma connaissance car ces infos ne sont intégrées dans les PDF. Par-contre je crois qu'il existe des logiciels capables de rechercher "par image".


Même pas dans le XMP ????
Go to the top of the page
 
+Quote Post
magicPDF
posté 19 Apr 2025, 14:08
Message #7


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 2 088
Inscrit : 22 Apr 2008
Lieu : 43.93 N / 4.84 E
Membre no 112 856



Citation (swamp @ 18 Apr 2025, 08:08) *
C'est à dire ?


Un PDF est un document autonome qui intègre tous les éléments qui le constitue. Il n'existe aucune référence extérieure pour les images, même pas leur nom original.


--------------------
Acrobate du PDF, InDesigner, Photoshopographe et WordPresseur
abracadabraPDF.net
Go to the top of the page
 
+Quote Post
swamp
posté 22 Apr 2025, 18:16
Message #8


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 1 540
Inscrit : 7 Feb 2005
Lieu : Il est 5 h... Paris s'éveille...
Membre no 32 590



Citation (magicPDF @ 19 Apr 2025, 14:08) *
Citation (swamp @ 18 Apr 2025, 08:08) *
C'est à dire ?


Un PDF est un document autonome qui intègre tous les éléments qui le constitue. Il n'existe aucune référence extérieure pour les images, même pas leur nom original.


OK donc pas d'issue possible sauf un éventuel programme magique que je ne connais pas. biggrin.gif


--------------------
Pour le café c'est bouilloire et cafetière à piston.
Go to the top of the page
 
+Quote Post
magicPDF
posté 23 Apr 2025, 10:26
Message #9


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 2 088
Inscrit : 22 Apr 2008
Lieu : 43.93 N / 4.84 E
Membre no 112 856



Acrobat Pro permet d'exporter toutes les images d'un document PDF, il les ordonne par numéro de page et par numéro d'ordre dans la page en partant du haut à gauche.
Quelques pistes pour la suite : https://www.google.com/search?q=logiciels+d...+image+pour+Mac


--------------------
Acrobate du PDF, InDesigner, Photoshopographe et WordPresseur
abracadabraPDF.net
Go to the top of the page
 
+Quote Post
Rémouel
posté 23 Apr 2025, 10:58
Message #10


Nouveau Membre


Groupe : Banned
Messages : 6
Inscrit : 17 Apr 2025
Membre no 220 452



Si c'est un fichier qui est fait avec un logiciel de design comme Illustrator ou Photoshop, si tu as accès à l'un de ces logiciels, il te suffit de l'ouvrir avec et tu pourras avoir accès à chaque calque avec le nom du calque.
C'est ce que je sais en tant que graphiste. Sinon, je ne connais pas perso un autre moyen de récupération.

Go to the top of the page
 
+Quote Post
magicPDF
posté 23 Apr 2025, 11:03
Message #11


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 2 088
Inscrit : 22 Apr 2008
Lieu : 43.93 N / 4.84 E
Membre no 112 856



Citation (Rémouel @ 23 Apr 2025, 10:58) *
Si c'est un fichier qui est fait avec un logiciel de design comme Illustrator ou Photoshop, si tu as accès à l'un de ces logiciels, il te suffit de l'ouvrir avec et tu pourras avoir accès à chaque calque avec le nom du calque.
C'est ce que je sais en tant que graphiste. Sinon, je ne connais pas perso un autre moyen de récupération.


Si c'est un PDF fait avec Illustrator ou Photoshop et qu'il a été exporté en "Conservant les fonctions d'édition…" il y a effectivement possibilité de récupérer les noms des images.
Dans tous les autres cas c'est non.
Voir :
https://www.abracadabrapdf.net/format_pdf/p...strator-et-pdf/
&
https://www.abracadabrapdf.net/format_pdf/p...otoshop-et-pdf/


--------------------
Acrobate du PDF, InDesigner, Photoshopographe et WordPresseur
abracadabraPDF.net
Go to the top of the page
 
+Quote Post
swamp
posté 23 Apr 2025, 13:39
Message #12


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 1 540
Inscrit : 7 Feb 2005
Lieu : Il est 5 h... Paris s'éveille...
Membre no 32 590



Citation (magicPDF @ 23 Apr 2025, 11:03) *
Citation (Rémouel @ 23 Apr 2025, 10:58) *
Si c'est un fichier qui est fait avec un logiciel de design comme Illustrator ou Photoshop, si tu as accès à l'un de ces logiciels, il te suffit de l'ouvrir avec et tu pourras avoir accès à chaque calque avec le nom du calque.
C'est ce que je sais en tant que graphiste. Sinon, je ne connais pas perso un autre moyen de récupération.


Si c'est un PDF fait avec Illustrator ou Photoshop et qu'il a été exporté en "Conservant les fonctions d'édition…" il y a effectivement possibilité de récupérer les noms des images.


Je pense que le logiciel utilisé est un traitement de textes, mais j'essaierai vos méthodes lundi prochain.


--------------------
Pour le café c'est bouilloire et cafetière à piston.
Go to the top of the page
 
+Quote Post
baron
posté 23 Apr 2025, 18:11
Message #13


Macbidouilleur d'Or !
*****

Groupe : Modérateurs
Messages : 19 964
Inscrit : 22 Jul 2004
Lieu : Louvain-la-Neuve (Gaule Gelbique)
Membre no 21 291



Le mieux que tu puisses faire, me semble-t-il, est d'ouvrir le PDF avec Acrobat Reader (ou Acrobat), d'afficher les propriétés du document (cmd-D) et de regarder avec quel programme le document a été créé. Ensuite, voir en fonction si tu as un espoir de retrouver trace des fichiers utilisés comme images dedans…


--------------------
MacBook Pro 14’’ 2021, M1 Pro, 16 Go/1 To – macOS  12.6 “Monterey”  MacBook Pro 15’’ mi-2010 Core i5 2,53 GHz, 8 Go/SSD Samsung 860EVO 1 To – Mac OSX 10.6.8  Power Macintosh G3 beige de bureau, rev.1 @ 233MHz, 288 Mo/4Go – MacOS 9.1 — + carte PCI IDE/ATA Tempo 66 Acard 6260 avec HD interne Maxtor 80 Go + graveur interne CDRW/DVD LG GCC-4520B + tablette A4 Wacom UD-0608-A + LaCie ElectronBlueIV 19" + HP ScanJet 6100C   B-Box 3 + HP LaserJet 4000 N  
La recherche dans MacBidouille vous paraît obscure ? J'ai rédigé une proposition de FAQ. Le moteur logiciel a un peu changé depuis mais ça peut aider quand même.
Les corsaires mettent en berne…
Go to the top of the page
 
+Quote Post
magicPDF
posté 23 Apr 2025, 18:27
Message #14


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 2 088
Inscrit : 22 Apr 2008
Lieu : 43.93 N / 4.84 E
Membre no 112 856



Citation (swamp @ 23 Apr 2025, 13:39) *
Je pense que le logiciel utilisé est un traitement de textes, mais j'essaierai vos méthodes lundi prochain.

Ne pense pas, vérifie dans les Propriétés du document, c'est indiqué. cool.gif


--------------------
Acrobate du PDF, InDesigner, Photoshopographe et WordPresseur
abracadabraPDF.net
Go to the top of the page
 
+Quote Post
swamp
posté 24 Apr 2025, 08:06
Message #15


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 1 540
Inscrit : 7 Feb 2005
Lieu : Il est 5 h... Paris s'éveille...
Membre no 32 590



Citation (magicPDF @ 23 Apr 2025, 18:27) *
Citation (swamp @ 23 Apr 2025, 13:39) *
Je pense que le logiciel utilisé est un traitement de textes, mais j'essaierai vos méthodes lundi prochain.

Ne pense pas, vérifie dans les Propriétés du document, c'est indiqué. cool.gif


ok !


--------------------
Pour le café c'est bouilloire et cafetière à piston.
Go to the top of the page
 
+Quote Post
joe cool
posté 24 Apr 2025, 10:32
Message #16


Macbidouilleur de vermeil !
****

Groupe : Membres
Messages : 820
Inscrit : 27 Dec 2002
Lieu : En haut à droite
Membre no 5 328



Un peu hors sujet, mais à l'inverse comment EMPECHER les quidams de voler récupérer les images/textes des pdf ?
Pour les textes un aplatissement peut ralentir, quoiqu’avec les IA&OCR, c'est plutôt mort.
Par contre pour les images vous avez une solution ?

(J'ai tenté de les verrouiller avec des mots de passes, mais en 30 secondes, j'ai touvé plein de sites web qui craquent les MDP.)

C'est mort ?


--------------------
MAC STUDIO/PRO - Macpro 5.1-24 + MBP retina et toute la gamme depuis le IIFx • PC • Sun • AS400 • Fofone • Papad...
Membre du club des AIPBP (Anciens Inscrits Pas Beaucoup de Posts) Voir la liste
Go to the top of the page
 
+Quote Post
baron
posté 24 Apr 2025, 11:35
Message #17


Macbidouilleur d'Or !
*****

Groupe : Modérateurs
Messages : 19 964
Inscrit : 22 Jul 2004
Lieu : Louvain-la-Neuve (Gaule Gelbique)
Membre no 21 291



Pour les images, à part les mettre en faible définition ou les affubler d'un filigrane, je ne vois pas… (Et là aussi, la protection n'est que relative.)


--------------------
MacBook Pro 14’’ 2021, M1 Pro, 16 Go/1 To – macOS  12.6 “Monterey”  MacBook Pro 15’’ mi-2010 Core i5 2,53 GHz, 8 Go/SSD Samsung 860EVO 1 To – Mac OSX 10.6.8  Power Macintosh G3 beige de bureau, rev.1 @ 233MHz, 288 Mo/4Go – MacOS 9.1 — + carte PCI IDE/ATA Tempo 66 Acard 6260 avec HD interne Maxtor 80 Go + graveur interne CDRW/DVD LG GCC-4520B + tablette A4 Wacom UD-0608-A + LaCie ElectronBlueIV 19" + HP ScanJet 6100C   B-Box 3 + HP LaserJet 4000 N  
La recherche dans MacBidouille vous paraît obscure ? J'ai rédigé une proposition de FAQ. Le moteur logiciel a un peu changé depuis mais ça peut aider quand même.
Les corsaires mettent en berne…
Go to the top of the page
 
+Quote Post
magicPDF
posté 25 Apr 2025, 09:34
Message #18


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 2 088
Inscrit : 22 Apr 2008
Lieu : 43.93 N / 4.84 E
Membre no 112 856



Citation (joe cool @ 24 Apr 2025, 10:32) *
Un peu hors sujet, mais à l'inverse comment EMPECHER les quidams de voler récupérer les images/textes des pdf ?


La meilleure méthode c'est de pas diffuser le document.
Sinon il existe des solutions pour appliquer des DRM sur le document mais ça coûte un bras.
Un exemple parmis d'autres : https://www.locklizard.com/pdf_security_viewer/


--------------------
Acrobate du PDF, InDesigner, Photoshopographe et WordPresseur
abracadabraPDF.net
Go to the top of the page
 
+Quote Post
joe cool
posté 25 Apr 2025, 10:09
Message #19


Macbidouilleur de vermeil !
****

Groupe : Membres
Messages : 820
Inscrit : 27 Dec 2002
Lieu : En haut à droite
Membre no 5 328



Merci pour vos réponses, qui ne font que confirmer mes craintes. sad.gif


--------------------
MAC STUDIO/PRO - Macpro 5.1-24 + MBP retina et toute la gamme depuis le IIFx • PC • Sun • AS400 • Fofone • Papad...
Membre du club des AIPBP (Anciens Inscrits Pas Beaucoup de Posts) Voir la liste
Go to the top of the page
 
+Quote Post
magicPDF
posté 25 Apr 2025, 21:56
Message #20


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 2 088
Inscrit : 22 Apr 2008
Lieu : 43.93 N / 4.84 E
Membre no 112 856



Si ça peut te rassurer ce n'est pas propre au PDF, ça vaut pour tous les types de fichier qu'on peut diffuser.


--------------------
Acrobate du PDF, InDesigner, Photoshopographe et WordPresseur
abracadabraPDF.net
Go to the top of the page
 
+Quote Post
designandco
posté 6 May 2025, 23:35
Message #21


Nouveau Membre


Groupe : Membres
Messages : 2
Inscrit : 6 May 2025
Membre no 220 502



Bonjour,

J'avais déjà fais un petit script Python qui extrait toutes les images du PDF.
Ensuite le script compare ces images à celles de ton disque dur (par ex. en faisant un hash MD5 des fichiers ou un hash perceptuel pour détecter les images même si elles ont été légèrement modifiées.

Je vais regarder si je le retrouve, mais même si vous savez pas coder, un script simple comme celui ci, se fait rapidement avec gpt

Ce message a été modifié par designandco - 6 May 2025, 23:35.
Go to the top of the page
 
+Quote Post
swamp
posté 2 Jun 2025, 18:23
Message #22


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 1 540
Inscrit : 7 Feb 2005
Lieu : Il est 5 h... Paris s'éveille...
Membre no 32 590



Citation (designandco @ 6 May 2025, 23:35) *
Bonjour,

J'avais déjà fais un petit script Python qui extrait toutes les images du PDF.
Ensuite le script compare ces images à celles de ton disque dur (par ex. en faisant un hash MD5 des fichiers ou un hash perceptuel pour détecter les images même si elles ont été légèrement modifiées.

Je vais regarder si je le retrouve, mais même si vous savez pas coder, un script simple comme celui ci, se fait rapidement avec gpt


Je ne aucune idée de ce qu'est un hash MD5 ou un hash perceptuel, mais c'est bien pour celles et ceux qui comprennent.


--------------------
Pour le café c'est bouilloire et cafetière à piston.
Go to the top of the page
 
+Quote Post
Laszlo Lebrun
posté 3 Jun 2025, 10:15
Message #23


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 2 506
Inscrit : 1 Nov 2021
Membre no 214 848



Citation (swamp @ 13 Apr 2025, 18:48) *
Bonjour,

J'ai récupéré un PDF avec des dizaines d'illustrations intégrées dans le fichier, mais sans légende ou non de fichier. Le boulot consiste à retrouver le fichier original stocké sur un DD, donc boulot fastidieux et surtout une grosse perte de temps.

La question : Existe-t'il un moyen de récupérer des données du fichier PDF avec le nom de chaque illustration ?


Quelle est la resolution d'origine de tes illustrations?
Avec un Mac 5K, on fait de très bonnes copies d'écran partielles.
Souvent je ne m'embête pas...


--------------------
"Les gens douteront toujours de la vérité sur Internet car l'erreur est constamment prêchée autour de nous" Johann Wolfgang von Goethe
MBP 15" 2014 Retina ( Win11), Macbook Air 2013 (en voyage), iMac 2015 27" Retina (Win11), Macbook blanc 2008 (Mate), pour ne citer que les Macs.
Go to the top of the page
 
+Quote Post
swamp
posté 5 Jun 2025, 17:51
Message #24


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 1 540
Inscrit : 7 Feb 2005
Lieu : Il est 5 h... Paris s'éveille...
Membre no 32 590



Citation (Laszlo Lebrun @ 3 Jun 2025, 10:15) *
Citation (swamp @ 13 Apr 2025, 18:48) *
Bonjour,

J'ai récupéré un PDF avec des dizaines d'illustrations intégrées dans le fichier, mais sans légende ou non de fichier. Le boulot consiste à retrouver le fichier original stocké sur un DD, donc boulot fastidieux et surtout une grosse perte de temps.

La question : Existe-t'il un moyen de récupérer des données du fichier PDF avec le nom de chaque illustration ?


Quelle est la resolution d'origine de tes illustrations?
Avec un Mac 5K, on fait de très bonnes copies d'écran partielles.
Souvent je ne m'embête pas...


L'objectif est juste d'identifier les illustrations choisies parmi des dizaines d'illustrations donc d'éviter de les repérer visuellement (perte de temps).

Ce message a été modifié par swamp - 5 Jun 2025, 17:52.


--------------------
Pour le café c'est bouilloire et cafetière à piston.
Go to the top of the page
 
+Quote Post

Reply to this topicStart new topic
1 utilisateur(s) sur ce sujet (1 invité(s) et 0 utilisateur(s) anonyme(s))
0 membre(s) :

 



Nous sommes le : 15th June 2025 - 04:31