Une appli maison: PDFZone, Extraire des données récurrentes de fichiers PDFs |
Bienvenue invité ( Connexion | Inscription )
Une appli maison: PDFZone, Extraire des données récurrentes de fichiers PDFs |
6 May 2017, 16:56
Message
#1
|
|
Adepte de Macbidouille Groupe : Membres Messages : 46 Inscrit : 6 May 2017 Membre no 202 086 |
Bonjour à tous et toutes ,
je viens vous présenter une app faite maison : PDFZone. Celle-ci a déjà été mentionnée dans un article sur macg. En résumé : PDFZone permet d'extraire des données récurrentes (ex: votre consommation électrique mensuelle sur votre facture) depuis des fichiers PDF. L'app se base sur des zones que l'utilisateur aura préalablement définies. Les données sont ensuite disponibles dans un fichier CSV (à importer dans Excel ou toute autre app de votre choix). Un cas concret d'utilisation : Si par exemple vous devez récupérer tous les mois des données d'une facture à des fins comptables, il suffit de cibler une fois ces éléments dans un document type et la moulinette de PDFZone procèdera ensuite automatiquement pour tous les PDF de même nature. Comment ça marche : 1) Définissez ce que vous voulez extraire : exemple : le numéro de facture 2) Pour chaque fournisseur de PDF, indiquez la zone où trouver le numéro de facture 3) Confiez tous vos PDFs à PDFZone pour analyse, l'app reconnaîtra de quel PDF il s'agit et extraira les données en fonction => Il ne vous reste plus qu'à exploiter vos données sur base du fichier CSV exporté, par exemple en traçant un graphique ou en important dans votre logiciel comptable (iCompta par exemple). Une vidéo de 57 secondes montrant l'app en action. Licence : - Gratuite (lien Mac App Store) avec certaines restrictions sur le nombre de PDFs à analyser en une seule fois - Payante (lien Mac App Store) Une page d'explication sur les deux versions. Le site web de l'app : http://www.pdfzoneapp.com Tout commentaire (ex: demande d'une nouvelle fonctionnalité) est le bienvenu! J'en profite pour signaler que la version payante est en promo (-50%) ce week-end ! Editus moderatus : la version 2 a fait aussi l'objet d'une news, ici : http://forum.macbidouille.com/index.php?sh...p;#entry4233746 -------------------- |
|
|
6 May 2017, 19:23
Message
#2
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 6 150 Inscrit : 31 Oct 2003 Membre no 11 118 |
Bravo pour cette appli, simple et efficace, elle mérite d'être connue, aussi j'ai laissé un commentaire sur le store.
Juste : les + et - en bas de la fenêtre sont trop discrets et manque une version française toutefois. -------------------- |
|
|
8 May 2017, 15:57
Message
#3
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 2 045 Inscrit : 22 Apr 2008 Lieu : 43.93 N / 4.84 E Membre no 112 856 |
Citation PDFZoneLite ne peut pas être installé sur “iMac” car OS X 10.11 ou ultérieur est requis. Quel dommage ! -------------------- Acrobate du PDF, InDesigner, Photoshopographe et WordPresseur
abracadabraPDF.net |
|
|
8 May 2017, 18:13
Message
#4
|
|
Adepte de Macbidouille Groupe : Membres Messages : 46 Inscrit : 6 May 2017 Membre no 202 086 |
Bravo pour cette appli, simple et efficace, elle mérite d'être connue, aussi j'ai laissé un commentaire sur le store. Juste : les + et - en bas de la fenêtre sont trop discrets et manque une version française toutefois. Merci pour ce retour. J'envisage la version française sous peu! -------------------- |
|
|
9 Aug 2017, 10:45
Message
#5
|
|
Adepte de Macbidouille Groupe : Membres Messages : 46 Inscrit : 6 May 2017 Membre no 202 086 |
Bonne nouvelle, PDFZone est maintenant disponible en français !
Il y a une promotion (50%) sur le prix de l'app pour fêter ça. Lien vers PDFZone en français Pour ceux qui souhaitent tester l'application gratuitement, une version LITE est disponible : plus d'infos sur le site pdfzoneapp.com -------------------- |
|
|
11 Aug 2017, 12:08
Message
#6
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 2 045 Inscrit : 22 Apr 2008 Lieu : 43.93 N / 4.84 E Membre no 112 856 |
Excellente application !
-------------------- Acrobate du PDF, InDesigner, Photoshopographe et WordPresseur
abracadabraPDF.net |
|
|
12 Aug 2017, 17:33
Message
#7
|
|
Adepte de Macbidouille Groupe : Membres Messages : 46 Inscrit : 6 May 2017 Membre no 202 086 |
Excellente application ! Merci beaucoup ! N'hésitez pas à laisser une évaluation sur le Mac App Store en soutien. Ce message a été modifié par vom - 16 Aug 2017, 12:05. -------------------- |
|
|
1 Sep 2017, 00:16
Message
#8
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 2 045 Inscrit : 22 Apr 2008 Lieu : 43.93 N / 4.84 E Membre no 112 856 |
On en parle aussi dans le forum international d'Adobe !
https://forums.adobe.com/message/9801505#9801505 Ce message a été modifié par magicPDF - 1 Sep 2017, 00:19. -------------------- Acrobate du PDF, InDesigner, Photoshopographe et WordPresseur
abracadabraPDF.net |
|
|
1 Sep 2017, 09:34
Message
#9
|
|
Adepte de Macbidouille Groupe : Membres Messages : 46 Inscrit : 6 May 2017 Membre no 202 086 |
On en parle aussi dans le forum international d'Adobe ! https://forums.adobe.com/message/9801505#9801505 Génial ! Merci pour cette découverte :-). -------------------- |
|
|
1 Sep 2017, 22:05
Message
#10
|
|
Macbidouilleur d'Or ! Groupe : Modérateurs Messages : 19 356 Inscrit : 22 Jul 2004 Lieu : Louvain-la-Neuve (Gaule Gelbique) Membre no 21 291 |
En l'occurrence, il faut plutôt gratifier notre ami MagicPDF d'une contribution que d'une découverte.
-------------------- ¶ MacBook Pro 14’’ 2021, M1 Pro, 16 Go/1 To – macOS 12.6 “Monterey” ¶ MacBook Pro 15’’ mi-2010 Core i5 2,53 GHz, 8 Go/SSD Samsung 860EVO 1 To – Mac OSX 10.6.8 ¶ Power Macintosh G3 beige de bureau, rev.1 @ 233MHz, 288 Mo/4Go – MacOS 9.1 + carte PCI IDE/ATA Tempo 66 Acard 6260 avec HD interne Maxtor 80 Go + graveur interne CDRW/DVD LG GCC-4520B + tablette A4 Wacom UD-0608-A + LaCie ElectronBlueIV 19" + HP ScanJet 6100C ¶ B-Box 3 + HP LaserJet 4000 N
¶ La recherche dans MacBidouille vous paraît obscure ? J'ai rédigé une proposition de FAQ. Le moteur logiciel a un peu changé depuis mais ça peut aider quand même. … Les corsaires mettent en berne… |
|
|
6 Oct 2017, 09:21
Message
#11
|
|
Adepte de Macbidouille Groupe : Membres Messages : 46 Inscrit : 6 May 2017 Membre no 202 086 |
En l'occurrence, il faut plutôt gratifier notre ami MagicPDF d'une contribution que d'une découverte. en effet, je n'avais pas fait le lien. Excellent, merci MagicPDF -------------------- |
|
|
6 Oct 2017, 14:51
Message
#12
|
|
Macbidouilleur d'Or ! Groupe : Rédacteurs Messages : 5 064 Inscrit : 19 Feb 2002 Lieu : BZH Membre no 2 083 |
Bonjour vom,
Je viens de tester vite ton application : Bravo ! Quelques idées : - Ajouter le XML comme format de sortie en plus du CSV, - Ajouter le format TXT (avec une ligne par objet sélectionné), - Une version CLI (ligne de commande) ? => intégrable dans un script ! Il ne te manque plus qu'une version Windows, qui ferait la même chose que sous Mac OS + les idées ci dessus. Pour info, et si tu veux t'inspirer d'idées, un américain fait un truc proche, PDFSpy En export XML, les données/textes présents sont donc structurés, facile de chercher/isoler ensuite à l'aide de XPath. Très pratique (tout comme ton application) pour extraire du texte d'un PDF, dont les coordonnées X;Y sont toujours les mêmes. En tout cas, félicitations. On peut même envisager une news, tiens ;-) A+ -------------------- Quis custodiet ipsos custodes ? - Lorsqu'un sujet est résolu, merci d'indiquer [Résolu] dans le titre de votre post !
Luttons contre le style SMS !!! iPhone 14Pro Max 256 Go iOS 17• MacBook Pro 16 2019 Core i9 - macOS 12.7.2 - 32 GB RAM - 2 TB • @Orange Linux • OPNSense / pfSense • Une pointe de Windows aussi • Enfocus Switch Expert • callas pdfToolBox |
|
|
9 Oct 2017, 18:15
Message
#13
|
|
Adepte de Macbidouille Groupe : Membres Messages : 46 Inscrit : 6 May 2017 Membre no 202 086 |
Salut trouspinette,
merci pour ton message, très sympa et aussi constructif! Concernant tes idées : - Export XML : c'est une bonne idée. As-tu une idée d'application qui pourrait exploiter ce format? - Export TXT : rien de plus simple, il suffit de changer l'extension du fichier CSV. C'est du texte dans les deux cas. Je peux le proposer en option, à voir si ce ne perturbera pas l'utilisateur - Version CLI : aaah celle-là ce n'est pas la première fois qu'on me le demande, je vais donc me pencher sérieusement dessus :-). Très intéressant PDFSpy, je ne connaissais pas et vais regarder à ça! Je me permets de signaler par la même occasion que PDFZone va au-delà des coordonnées X & Y : - s'adapte aux PDFs scannés et à leurs variations de coordonnées dues au scan - la fonctionnalité "voisin de confiance" : permet d'extraire du texte qui n'a pas toujours les mêmes coordonnées, en définissant un voisin qui aura toujours le même nom. Exemple: sur une facture, le montant total peut changer de position en fonction du nombre d'éléments composant la facture. Il sera souvent positionné d'autant plus bas si le nombre d'éléments composant la facture augmente. Du coup, en définissant un voisin de confiance sur "Total HTVA" (par exemple), on retrouvera toujours le champ exact contenant la valeur de ce total (ex: 384 €). Enfin, je serais ravi que l'application fasse l'objet d'une news, ce serait vraiment sympa! Merci et bonne soirée à tous! PS : toute nouvelle idée pour l'appli est la bienvenue, je ne demande qu'à l'améliorer! -------------------- |
|
|
25 Oct 2017, 13:28
Message
#14
|
|
Macbidouilleur d'Or ! Groupe : Modérateurs Messages : 19 356 Inscrit : 22 Jul 2004 Lieu : Louvain-la-Neuve (Gaule Gelbique) Membre no 21 291 |
Enfin, je serais ravi que l'application fasse l'objet d'une news, ce serait vraiment sympa! Trouspinette a réalisé ton vœu : • http://macbidouille.com/news/2017/10/24/pd...sme-dans-un-pdf |
|
|
26 Oct 2017, 09:19
Message
#15
|
|
Adepte de Macbidouille Groupe : Membres Messages : 46 Inscrit : 6 May 2017 Membre no 202 086 |
Enfin, je serais ravi que l'application fasse l'objet d'une news, ce serait vraiment sympa! Trouspinette a réalisé ton vœu : • http://macbidouille.com/news/2017/10/24/pd...sme-dans-un-pdf -------------------- |
|
|
1 Dec 2017, 11:32
Message
#16
|
|
Adepte de Macbidouille Groupe : Membres Messages : 46 Inscrit : 6 May 2017 Membre no 202 086 |
Bonne nouvelle pour les francophones !
Après l'appli elle-même, une grosse mise à jour a été faite sur le site : celui-ci est entièrement disponible en français ! Le résultat est ici : PDFZone en français J'espère que ça aidera les visiteurs à mieux comprendre l'app ! -------------------- |
|
|
1 Dec 2017, 12:00
Message
#17
|
|
Champollion 2k5 Groupe : Modérateurs Messages : 7 009 Inscrit : 15 Jun 2003 Lieu : ...partout et nulle part... Membre no 8 070 |
La suite par ici !
-------------------- MacBook Pro 16" M1 Max 64Go/2To Sonoma Don't believe anything you read on the net. Except this. Well, including this, I suppose (Douglas Adams) Perhaps the answer to the question lies in the question (Police Me - Tori Amos) |
|
|
22 Jun 2018, 22:24
Message
#18
|
|
Macbidouilleur d'Or ! Groupe : Modérateurs Messages : 19 356 Inscrit : 22 Jul 2004 Lieu : Louvain-la-Neuve (Gaule Gelbique) Membre no 21 291 |
Une autre news annonce la version 2 :
• http://forum.macbidouille.com/index.php?showtopic=408514 -------------------- ¶ MacBook Pro 14’’ 2021, M1 Pro, 16 Go/1 To – macOS 12.6 “Monterey” ¶ MacBook Pro 15’’ mi-2010 Core i5 2,53 GHz, 8 Go/SSD Samsung 860EVO 1 To – Mac OSX 10.6.8 ¶ Power Macintosh G3 beige de bureau, rev.1 @ 233MHz, 288 Mo/4Go – MacOS 9.1 + carte PCI IDE/ATA Tempo 66 Acard 6260 avec HD interne Maxtor 80 Go + graveur interne CDRW/DVD LG GCC-4520B + tablette A4 Wacom UD-0608-A + LaCie ElectronBlueIV 19" + HP ScanJet 6100C ¶ B-Box 3 + HP LaserJet 4000 N
¶ La recherche dans MacBidouille vous paraît obscure ? J'ai rédigé une proposition de FAQ. Le moteur logiciel a un peu changé depuis mais ça peut aider quand même. … Les corsaires mettent en berne… |
|
|
Nous sommes le : 26th April 2024 - 10:01 |