tesseract, un puissant OCR en ligne de commande |
Bienvenue invité ( Connexion | Inscription )
tesseract, un puissant OCR en ligne de commande |
10 Jan 2022, 11:07
Message
#1
|
|
Macbidouilleur de vermeil ! Groupe : Membres Messages : 1 336 Inscrit : 19 May 2003 Lieu : Vendée Membre no 7 668 |
Bonjour,
À la recherche, il y a quelques semaines, d'un logiciel OCR, et ne trouvant pas satisfaction dans ce que propose l'Apple Store, l'idée me vint alors qu'il pût en exister en ligne de commande. Quelle bien m'en a pris. J'ai trouvé tesseract dans la liste des paquets MacPort, et j'ai pu en expérimenter l'incroyable puissance. À partir de scan pas parfaitement nets pris avec Scannable sur un vieil iPhone 4S envoyés sur mon iMac, le résultat dépasse tout ce que j'ai pu connaître auparavant. Sur quatre pages de texte, une seule erreur. Il faut installer le paquet tesseract, puis les langues, au minimum l'anglais — tesseract-eng — et le français — tesseract-fra (sans l'anglais, ça ne fonctionne pas, à ce que j'ai pu observer). Code port list tesseract tesseract @4.1.3 textproc/tesseract tesseract --list-langs List of available languages (4): deu eng fra grc Voici la commande, en précisant en options la résolution de l'image et la langue: Code tesseract Source Cible --dpi 72 -l fra En espérant que ce petit OCR en ligne de commande sera utile à quelques uns. Ce message a été modifié par fgiron - 10 Jan 2022, 11:10. -------------------- [size=1]iMac 24", M1, 1To, 16 Go, Sonoma 14.1
iMac 24', 650 Go, Ram 4 Go, Intel Core 2 Duo 3.06 GHz, OS X 10.10.5 Airport Express 7.6.1 - Time Capsule 2 To 7.6.1 - iPod classic 160 Go |
|
|
10 Jan 2022, 19:05
Message
#2
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 10 286 Inscrit : 4 Nov 2002 Lieu : Carcassonne Membre no 4 494 |
Merci pour l'info
-------------------- Raspberry Pi5 8Go Ram / Dissipateur thermique et ventilo / PIMORONI NVMe BASE PCIe 3.0 / SSD NVMe M.2 Crucial P3 PLUS 500Go
Raspberry Pi4 B (Overclock 2.0 Ghz) / 4 Go Ram / SSD Samsung T5 500 Go Usb3 / Ventila Pi4 / Raspberry Pi OS (Buster) / boot SD Card / rootfs SSD (fait accessoirement office de serveur pour Apple TV 4K 128Go) Raspberry Pi4 B / 2 Go Ram/ SD 16Go / RETROFLAG NESPI 4 Case / Recalbox 7.2 / Kodi 18 / 8BitDo SN30 Pro+ Pac Man et 1942 MacBook 6,1 2009 / 8 Go Ram Corsair /SSD Crucial 500MX 500 Go SATA / (Single boot) Ubuntu 18.04.4 LTS (Bionic Beaver) Support 10 ans MacBook Pro 8,1 2011 / 8 Go Ram Corsair /SSD Crucial 500MX 500 Go SATA / (Single boot) Ubuntu 18.04.4 LTS (Bionic Beaver) Support 10 ans HP X360 (LORdi) 2015 / 4 Go Ram / SSD 250 Go M2 / (Single boot) Ubuntu 20.04 LTS (Focal Fossa) Support 10 ans HP Laptop 17 Core i3-11th gen 3.00GHz x 4 / 8 Go Ram / SSD 512 Go / (Single boot) Zorin 16.3 Apple TV 4K 128Go / 8BitDo SN30 Pro+ Je remercie la fondation Raspberry qui me redonne une ame d'enfant avec un ordinateur, comme Apple avait su le faire dans les années 80. Trek Emonda SL6 pour le plaisir, pour s'amuser et se faire mal :) Ultegra 50x34/11x28, Ksyrium Pro, Keo Blade Carbon, Edge 520Plus, |
|
|
10 Jan 2022, 19:24
Message
#3
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 2 936 Inscrit : 23 Nov 2002 Membre no 4 808 |
le test va venir ;-)
Peut-être déplacer le fil dans 'autres logiciels', il aura plus de chances d'être lu… -------------------- MBP 15 unibody (circa 2010) 2,4 Ghz , 4Go ssd 256 Go, dual boot OSX10.9.5-Linux mint
MacMini late 2012, i7 2,3Ghz, 16Go, 2 ssd 1to, OSX Sonoma 14.6.1 dual boot Sequoia 15 (OpencoreLegacy Patcher 2.1) |
|
|
10 Jan 2022, 21:43
Message
#4
|
|
The Original Martian <span style= Groupe : Modérateurs Messages : 6 730 Inscrit : 25 May 2004 Lieu : sɹɐɯ ⅋ ʞɹoʎ ʍǝu ʍǝu ⅋ ǝssᴉns Membre no 19 190 |
Un logiciel OCR en ligne de commande ... Je pense qu'il a sa place dans la sectionn Unix
-------------------- MBP 16" Sequoia 15.0 MBA 13" Sonoma 14.6.1
DBCM III Disciple du MSV Team BOINC Macbidouille But I'm a creep, I'm a weirdo - What the hell am I doin here? - I don't belong here Radiohead Il vaut mieux mobiliser son intelligence sur des conneries que mobiliser sa connerie sur des choses intelligentes - S'il n'y a pas de solution, c'est qu'il n'y a pas de problème - Devises Shadok La connaissance, c'est savoir que la tomate est un fruit. La sagesse, c'est savoir qu'il ne faut pas la mettre dans une salade de fruit. B O'D |
|
|
10 Jan 2022, 22:23
Message
#5
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 2 300 Inscrit : 1 Nov 2021 Membre no 214 848 |
J'ai trouvé tesseract dans la liste des paquets MacPort, et j'ai pu en expérimenter l'incroyable puissance. ... En espérant que ce petit OCR en ligne de commande sera utile à quelques uns. Ca décode les PDF d'images? Euh... comme c'est in logiciel de Google, il fonctionne off-line, ou ca téléphone l'image à Google qui fait l'OCR, se sert au passge et renvoie le résultat? Ce message a été modifié par Laszlo Lebrun - 10 Jan 2022, 22:25. -------------------- "Les gens douteront toujours de la vérité sur Internet car l'erreur est constamment prêchée autour de nous" Johann Wolfgang von Goethe
MBP 15" 2014 Retina ( Win11 + Mojave), Macbook Air 2013 (en voyage), iMac 2015 27" Retina (Mojave + Win11), Macbook blanc 2008 (Mate), pour ne citer que les Macs. |
|
|
11 Jan 2022, 01:42
Message
#6
|
|
Macbidouilleur d'Or ! Groupe : Modérateurs Messages : 19 573 Inscrit : 22 Jul 2004 Lieu : Louvain-la-Neuve (Gaule Gelbique) Membre no 21 291 |
Ça semble bien travailler offline.
On trouve la doc ici : • https://tesseract-ocr.github.io/tessdoc/ (Remarquable ! Le chapitre sur l'amélioration de l'OCR… ) Et le logiciel : • https://github.com/tesseract-ocr/tesseract/ -------------------- ¶ MacBook Pro 14’’ 2021, M1 Pro, 16 Go/1 To – macOS 12.6 “Monterey” ¶ MacBook Pro 15’’ mi-2010 Core i5 2,53 GHz, 8 Go/SSD Samsung 860EVO 1 To – Mac OSX 10.6.8 ¶ Power Macintosh G3 beige de bureau, rev.1 @ 233MHz, 288 Mo/4Go – MacOS 9.1 + carte PCI IDE/ATA Tempo 66 Acard 6260 avec HD interne Maxtor 80 Go + graveur interne CDRW/DVD LG GCC-4520B + tablette A4 Wacom UD-0608-A + LaCie ElectronBlueIV 19" + HP ScanJet 6100C ¶ B-Box 3 + HP LaserJet 4000 N
¶ La recherche dans MacBidouille vous paraît obscure ? J'ai rédigé une proposition de FAQ. Le moteur logiciel a un peu changé depuis mais ça peut aider quand même. … Les corsaires mettent en berne… |
|
|
11 Jan 2022, 04:15
Message
#7
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 2 300 Inscrit : 1 Nov 2021 Membre no 214 848 |
Et le logiciel : • https://github.com/tesseract-ocr/tesseract/ Merci, Ca m'a permis de trouver cela: https://github.com/dynobo/normcap Un logiciel génial, basé sur Tesseract, qui fait un OCR sur une partie de l'écran et met le résultat dans le presse-papiers. Absolument utile pour la sauvegarde des messages d'erreurs (ou chaque fois le developpeur oublie de prévoir de rendre le message copiable) ou pour des listes de fichiers finder. Gratos, naturellement, vous connaissez mieux? Ce message a été modifié par Laszlo Lebrun - 11 Jan 2022, 04:17. -------------------- "Les gens douteront toujours de la vérité sur Internet car l'erreur est constamment prêchée autour de nous" Johann Wolfgang von Goethe
MBP 15" 2014 Retina ( Win11 + Mojave), Macbook Air 2013 (en voyage), iMac 2015 27" Retina (Mojave + Win11), Macbook blanc 2008 (Mate), pour ne citer que les Macs. |
|
|
11 Jan 2022, 05:14
Message
#8
|
|
The Original Martian <span style= Groupe : Modérateurs Messages : 6 730 Inscrit : 25 May 2004 Lieu : sɹɐɯ ⅋ ʞɹoʎ ʍǝu ʍǝu ⅋ ǝssᴉns Membre no 19 190 |
Pour les amateurs de Python (dont je suis) il y a pytesseract , un "wrapper" Python3 de tesseract.
-------------------- MBP 16" Sequoia 15.0 MBA 13" Sonoma 14.6.1
DBCM III Disciple du MSV Team BOINC Macbidouille But I'm a creep, I'm a weirdo - What the hell am I doin here? - I don't belong here Radiohead Il vaut mieux mobiliser son intelligence sur des conneries que mobiliser sa connerie sur des choses intelligentes - S'il n'y a pas de solution, c'est qu'il n'y a pas de problème - Devises Shadok La connaissance, c'est savoir que la tomate est un fruit. La sagesse, c'est savoir qu'il ne faut pas la mettre dans une salade de fruit. B O'D |
|
|
Guest_Neutral_ch_* |
11 Jan 2022, 08:14
Message
#9
|
Guests |
Mais que font les Avengers?
|
|
|
11 Jan 2022, 08:32
Message
#10
|
|
Macbidouilleur d'Or ! Groupe : Modérateurs Messages : 19 573 Inscrit : 22 Jul 2004 Lieu : Louvain-la-Neuve (Gaule Gelbique) Membre no 21 291 |
-------------------- ¶ MacBook Pro 14’’ 2021, M1 Pro, 16 Go/1 To – macOS 12.6 “Monterey” ¶ MacBook Pro 15’’ mi-2010 Core i5 2,53 GHz, 8 Go/SSD Samsung 860EVO 1 To – Mac OSX 10.6.8 ¶ Power Macintosh G3 beige de bureau, rev.1 @ 233MHz, 288 Mo/4Go – MacOS 9.1 + carte PCI IDE/ATA Tempo 66 Acard 6260 avec HD interne Maxtor 80 Go + graveur interne CDRW/DVD LG GCC-4520B + tablette A4 Wacom UD-0608-A + LaCie ElectronBlueIV 19" + HP ScanJet 6100C ¶ B-Box 3 + HP LaserJet 4000 N
¶ La recherche dans MacBidouille vous paraît obscure ? J'ai rédigé une proposition de FAQ. Le moteur logiciel a un peu changé depuis mais ça peut aider quand même. … Les corsaires mettent en berne… |
|
|
Guest_Neutral_ch_* |
11 Jan 2022, 08:37
Message
#11
|
Guests |
|
|
|
11 Jan 2022, 09:18
Message
#12
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 2 300 Inscrit : 1 Nov 2021 Membre no 214 848 |
Pour les amateurs de Python (dont je suis) il y a pytesseract , un "wrapper" Python3 de tesseract. Tu serais capable de faire en python avec ca une appli qui "pompe" chaque seconde une valeur d'une page web par un simple lasso rectangulaire et la sort en texte? -------------------- "Les gens douteront toujours de la vérité sur Internet car l'erreur est constamment prêchée autour de nous" Johann Wolfgang von Goethe
MBP 15" 2014 Retina ( Win11 + Mojave), Macbook Air 2013 (en voyage), iMac 2015 27" Retina (Mojave + Win11), Macbook blanc 2008 (Mate), pour ne citer que les Macs. |
|
|
11 Jan 2022, 16:40
Message
#13
|
|
The Original Martian <span style= Groupe : Modérateurs Messages : 6 730 Inscrit : 25 May 2004 Lieu : sɹɐɯ ⅋ ʞɹoʎ ʍǝu ʍǝu ⅋ ǝssᴉns Membre no 19 190 |
Ça dépasse de loin mes compétences
-------------------- MBP 16" Sequoia 15.0 MBA 13" Sonoma 14.6.1
DBCM III Disciple du MSV Team BOINC Macbidouille But I'm a creep, I'm a weirdo - What the hell am I doin here? - I don't belong here Radiohead Il vaut mieux mobiliser son intelligence sur des conneries que mobiliser sa connerie sur des choses intelligentes - S'il n'y a pas de solution, c'est qu'il n'y a pas de problème - Devises Shadok La connaissance, c'est savoir que la tomate est un fruit. La sagesse, c'est savoir qu'il ne faut pas la mettre dans une salade de fruit. B O'D |
|
|
11 Jan 2022, 18:11
Message
#14
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 10 286 Inscrit : 4 Nov 2002 Lieu : Carcassonne Membre no 4 494 |
Testé sur Pi4 ça fonctionne pas mal
Je vais me pencher sur Normcap, pour le moment ça coince a l'install Edit:Apres installation de xclip a la main, Normcap fonctionne sur Pi4. Plutôt pas mal ça peut dépanner effectivement Et voili, intégration de Normcap dans la barre de Menu de mon Pi4 Accès en un clic. Edit: après utilisation régulièrement depuis, pour récupérer avec un utilitaire qui m’affiche des infos en temps réel sur mon fond d’écran, l’ocr a du mal à interpréter les données. Ocr et assistants vocaux mêmes combat. Ça marche, mais toujours dans certaines conditions, mais ça fait jamais de miracles. Ce message a été modifié par Fars - 15 Jan 2022, 08:29. -------------------- Raspberry Pi5 8Go Ram / Dissipateur thermique et ventilo / PIMORONI NVMe BASE PCIe 3.0 / SSD NVMe M.2 Crucial P3 PLUS 500Go
Raspberry Pi4 B (Overclock 2.0 Ghz) / 4 Go Ram / SSD Samsung T5 500 Go Usb3 / Ventila Pi4 / Raspberry Pi OS (Buster) / boot SD Card / rootfs SSD (fait accessoirement office de serveur pour Apple TV 4K 128Go) Raspberry Pi4 B / 2 Go Ram/ SD 16Go / RETROFLAG NESPI 4 Case / Recalbox 7.2 / Kodi 18 / 8BitDo SN30 Pro+ Pac Man et 1942 MacBook 6,1 2009 / 8 Go Ram Corsair /SSD Crucial 500MX 500 Go SATA / (Single boot) Ubuntu 18.04.4 LTS (Bionic Beaver) Support 10 ans MacBook Pro 8,1 2011 / 8 Go Ram Corsair /SSD Crucial 500MX 500 Go SATA / (Single boot) Ubuntu 18.04.4 LTS (Bionic Beaver) Support 10 ans HP X360 (LORdi) 2015 / 4 Go Ram / SSD 250 Go M2 / (Single boot) Ubuntu 20.04 LTS (Focal Fossa) Support 10 ans HP Laptop 17 Core i3-11th gen 3.00GHz x 4 / 8 Go Ram / SSD 512 Go / (Single boot) Zorin 16.3 Apple TV 4K 128Go / 8BitDo SN30 Pro+ Je remercie la fondation Raspberry qui me redonne une ame d'enfant avec un ordinateur, comme Apple avait su le faire dans les années 80. Trek Emonda SL6 pour le plaisir, pour s'amuser et se faire mal :) Ultegra 50x34/11x28, Ksyrium Pro, Keo Blade Carbon, Edge 520Plus, |
|
|
26 Dec 2023, 07:23
Message
#15
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 1 970 Inscrit : 22 Dec 2011 Lieu : Paris Membre no 173 181 |
installé normcap, il se lance normalement via Terminal
Mais en sélectionnant une fenêtre de safari, normalement un liséré rouge doit apparaître tout autour de la fenêtre d'après la doc. Or c'est pas le cas -------------------- ¶ Mon blog informatique est la Vague en Creux
¶ MacBook Pro de 2021 avec OS 14.4 Sonoma, 13 pouces, 16 Go de mémoire RAM, processeur M1, SSD de 500Go ¶ Autre MacBook Pro de 2015 avec OS 10.14.5 Mojave 15 pouces Retina, 16 Go de mémoire RAM, processeur quadri-core 2.5 GHz Intel Core , double carte graphique et SSD 512 Go ¶ Nous sommes 2 sur ce site: Jean Pass & Dem Eilleur qui vous saluons bien !“ |
|
|
26 Dec 2023, 09:35
Message
#16
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 2 300 Inscrit : 1 Nov 2021 Membre no 214 848 |
Pour les amateurs de Python (dont je suis) il y a pytesseract , un "wrapper" Python3 de tesseract. Tu serais capable de faire en python avec ca une appli qui "pompe" chaque seconde une valeur d'une page web par un simple lasso rectangulaire et la sort en texte? Update: je suis allé voir les gentils hackers du Chaos Computer Club, mon idée leur a plu. Ils s'y sont pris autrement, mais j'ai mon programme Python qui ronronne. installé normcap, il se lance normalement via Terminal Mais en sélectionnant une fenêtre de safari, normalement un liséré rouge doit apparaître tout autour de la fenêtre d'après la doc. Or c'est pas le cas Ça marche pour les autres applis? Est ce que tu a donné les autorisations a Normcap? -------------------- "Les gens douteront toujours de la vérité sur Internet car l'erreur est constamment prêchée autour de nous" Johann Wolfgang von Goethe
MBP 15" 2014 Retina ( Win11 + Mojave), Macbook Air 2013 (en voyage), iMac 2015 27" Retina (Mojave + Win11), Macbook blanc 2008 (Mate), pour ne citer que les Macs. |
|
|
26 Dec 2023, 12:36
Message
#17
|
|
Macbidouilleur d'Or ! Groupe : Membres Messages : 1 970 Inscrit : 22 Dec 2011 Lieu : Paris Membre no 173 181 |
... installé normcap, il se lance normalement via Terminal Mais en sélectionnant une fenêtre de safari, normalement un liséré rouge doit apparaître tout autour de la fenêtre d'après la doc. Or c'est pas le cas Ça marche pour les autres applis? Est ce que tu a donné les autorisations a Normcap? Ça marche super bien: il suffisait d'autoriser les notifications pythons Je sens que ça va me servir ce truc, merci -------------------- ¶ Mon blog informatique est la Vague en Creux
¶ MacBook Pro de 2021 avec OS 14.4 Sonoma, 13 pouces, 16 Go de mémoire RAM, processeur M1, SSD de 500Go ¶ Autre MacBook Pro de 2015 avec OS 10.14.5 Mojave 15 pouces Retina, 16 Go de mémoire RAM, processeur quadri-core 2.5 GHz Intel Core , double carte graphique et SSD 512 Go ¶ Nous sommes 2 sur ce site: Jean Pass & Dem Eilleur qui vous saluons bien !“ |
|
|
Nous sommes le : 26th September 2024 - 08:13 |