IPB

Bienvenue invité ( Connexion | Inscription )

 
Reply to this topicStart new topic
> tesseract, un puissant OCR en ligne de commande
Options
fgiron
posté 10 Jan 2022, 11:07
Message #1


Macbidouilleur de vermeil !
****

Groupe : Membres
Messages : 1 336
Inscrit : 19 May 2003
Lieu : Vendée
Membre no 7 668



Bonjour,

À la recherche, il y a quelques semaines, d'un logiciel OCR, et ne trouvant pas satisfaction dans ce que propose l'Apple Store, l'idée me vint alors qu'il pût en exister en ligne de commande. Quelle bien m'en a pris.
J'ai trouvé tesseract dans la liste des paquets MacPort, et j'ai pu en expérimenter l'incroyable puissance.
À partir de scan pas parfaitement nets pris avec Scannable sur un vieil iPhone 4S envoyés sur mon iMac, le résultat dépasse tout ce que j'ai pu connaître auparavant. Sur quatre pages de texte, une seule erreur.
Il faut installer le paquet tesseract, puis les langues, au minimum l'anglais — tesseract-eng — et le français — tesseract-fra (sans l'anglais, ça ne fonctionne pas, à ce que j'ai pu observer).

Code
port list tesseract                                                            
tesseract                      @4.1.3          textproc/tesseract
tesseract --list-langs                                                          
List of available languages (4):
deu
eng
fra
grc


Voici la commande, en précisant en options la résolution de l'image et la langue:

Code
tesseract Source Cible --dpi 72 -l fra


En espérant que ce petit OCR en ligne de commande sera utile à quelques uns.

Ce message a été modifié par fgiron - 10 Jan 2022, 11:10.


--------------------
[size=1]iMac 24", M1, 1To, 16 Go, Sonoma 14.1
iMac 24', 650 Go, Ram 4 Go, Intel Core 2 Duo 3.06 GHz, OS X 10.10.5
Airport Express 7.6.1 - Time Capsule 2 To 7.6.1 - iPod classic 160 Go
Go to the top of the page
 
+Quote Post
Fars
posté 10 Jan 2022, 19:05
Message #2


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 10 235
Inscrit : 4 Nov 2002
Lieu : Carcassonne
Membre no 4 494



Merci pour l'info wink.gif


--------------------
Raspberry Pi5 8Go Ram / Dissipateur thermique et ventilo / PIMORONI NVMe BASE PCIe 3.0 / SSD NVMe M.2 Crucial P3 PLUS 500Go
Raspberry Pi4 B (Overclock 2.0 Ghz) / 4 Go Ram / SSD Samsung T5 500 Go Usb3 / Ventila Pi4 / Raspberry Pi OS (Buster) / boot SD Card / rootfs SSD (fait accessoirement office de serveur pour Apple TV 4K 128Go)
Raspberry Pi4 B / 2 Go Ram/ SD 16Go / RETROFLAG NESPI 4 Case / Recalbox 7.2 / Kodi 18 / 8BitDo SN30 Pro+ Pac Man et 1942
MacBook 6,1 2009 / 8 Go Ram Corsair /SSD Crucial 500MX 500 Go SATA / (Single boot) Ubuntu 18.04.4 LTS (Bionic Beaver) Support 10 ans
MacBook Pro 8,1 2011 / 8 Go Ram Corsair /SSD Crucial 500MX 500 Go SATA / (Single boot) Ubuntu 18.04.4 LTS (Bionic Beaver) Support 10 ans
HP X360 (LORdi) 2015 / 4 Go Ram / SSD 250 Go M2 / (Single boot) Ubuntu 20.04 LTS (Focal Fossa) Support 10 ans
HP Laptop 17 Core i3-11th gen 3.00GHz x 4 / 8 Go Ram / SSD 512 Go / (Single boot) Zorin 16.3
Apple TV 4K 128Go / 8BitDo SN30 Pro+
Je remercie la fondation Raspberry qui me redonne une ame d'enfant avec un ordinateur, comme Apple avait su le faire dans les années 80.
Trek Emonda SL6 pour le plaisir, pour s'amuser et se faire mal :) Ultegra 50x34/11x28, Ksyrium Pro, Keo Blade Carbon, Edge 520Plus, GP5000. Vittoria Rubino Pro G2
Go to the top of the page
 
+Quote Post
ades
posté 10 Jan 2022, 19:24
Message #3


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 2 845
Inscrit : 23 Nov 2002
Membre no 4 808



le test va venir ;-)
Peut-être déplacer le fil dans 'autres logiciels', il aura plus de chances d'être lu…


--------------------
MBP 15 unibody 2,4 Ghz , 4Go ssd 256 Go, dual boot OSX10.9.5-Linux mint
MacMini late 2012, i7 2,3Ghz, 16Go, 2 ssd 1to, OSX Sonoma 14.4 (OpencoreLegacy Patcher 1,4.3)
Go to the top of the page
 
+Quote Post
Phil J. Fry
posté 10 Jan 2022, 21:43
Message #4


The Original Martian & DBCM
*****

Groupe : Modérateurs
Messages : 6 552
Inscrit : 25 May 2004
Lieu : sɹɐɯ ⅋ ʞɹoʎ ʍǝu ʍǝu ⅋ ǝssᴉns
Membre no 19 190



huh.gif Un logiciel OCR en ligne de commande ... Je pense qu'il a sa place dans la sectionn Unix unsure.gif


--------------------
MBP 16" Sonoma 14.4.1 MBA 13" Sonoma 14.4.1 MacBook Air 11" 10.9.5 MacBook 2Ghz 1Go X.6.4 blanc Mac Mini 1.25Ghz 1Go X.4.10 Spatule de 10,5 cm iPod shuffle 512 iPod mini 4GB iPod Nano 16GB
DBCM III Disciple du MSV Team BOINC Macbidouille
But I'm a creep, I'm a weirdo - What the hell am I doin here? - I don't belong here Radiohead
Il vaut mieux mobiliser son intelligence sur des conneries que mobiliser sa connerie sur des choses intelligentes - S'il n'y a pas de solution, c'est qu'il n'y a pas de problème - Devises Shadok
La connaissance, c'est savoir que la tomate est un fruit. La sagesse, c'est savoir qu'il ne faut pas la mettre dans une salade de fruit. B O'D
Go to the top of the page
 
+Quote Post
Laszlo Lebrun
posté 10 Jan 2022, 22:23
Message #5


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 2 188
Inscrit : 1 Nov 2021
Membre no 214 848



Citation (fgiron @ 10 Jan 2022, 11:07) *
J'ai trouvé tesseract dans la liste des paquets MacPort, et j'ai pu en expérimenter l'incroyable puissance.
...
En espérant que ce petit OCR en ligne de commande sera utile à quelques uns.


Ca décode les PDF d'images?

Euh... comme c'est in logiciel de Google, il fonctionne off-line, ou ca téléphone l'image à Google qui fait l'OCR, se sert au passge et renvoie le résultat?

Ce message a été modifié par Laszlo Lebrun - 10 Jan 2022, 22:25.


--------------------
"Les gens douteront toujours de la vérité sur Internet car l'erreur est constamment prêchée autour de nous" Johann Wolfgang von Goethe
MBP 15" 2014 Retina ( Win11 + Mojave), Macbook Air 2013 (en voyage), iMac 2015 27" Retina (Mojave + Win11), Macbook blanc 2008 (Mate), pour ne citer que les Macs.
Go to the top of the page
 
+Quote Post
baron
posté 11 Jan 2022, 01:42
Message #6


Macbidouilleur d'Or !
*****

Groupe : Modérateurs
Messages : 19 353
Inscrit : 22 Jul 2004
Lieu : Louvain-la-Neuve (Gaule Gelbique)
Membre no 21 291



Ça semble bien travailler offline.

On trouve la doc ici :
https://tesseract-ocr.github.io/tessdoc/ (Remarquable ! Le chapitre sur l'amélioration de l'OCRsleep.gif )

Et le logiciel :
https://github.com/tesseract-ocr/tesseract/


--------------------
MacBook Pro 14’’ 2021, M1 Pro, 16 Go/1 To – macOS  12.6 “Monterey”  MacBook Pro 15’’ mi-2010 Core i5 2,53 GHz, 8 Go/SSD Samsung 860EVO 1 To – Mac OSX 10.6.8  Power Macintosh G3 beige de bureau, rev.1 @ 233MHz, 288 Mo/4Go – MacOS 9.1 — + carte PCI IDE/ATA Tempo 66 Acard 6260 avec HD interne Maxtor 80 Go + graveur interne CDRW/DVD LG GCC-4520B + tablette A4 Wacom UD-0608-A + LaCie ElectronBlueIV 19" + HP ScanJet 6100C   B-Box 3 + HP LaserJet 4000 N  
La recherche dans MacBidouille vous paraît obscure ? J'ai rédigé une proposition de FAQ. Le moteur logiciel a un peu changé depuis mais ça peut aider quand même.
Les corsaires mettent en berne…
Go to the top of the page
 
+Quote Post
Laszlo Lebrun
posté 11 Jan 2022, 04:15
Message #7


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 2 188
Inscrit : 1 Nov 2021
Membre no 214 848



Citation (baron @ 11 Jan 2022, 01:42) *

Merci,

Ca m'a permis de trouver cela:

https://github.com/dynobo/normcap

Un logiciel génial, basé sur Tesseract, qui fait un OCR sur une partie de l'écran et met le résultat dans le presse-papiers.
Absolument utile pour la sauvegarde des messages d'erreurs (ou chaque fois le developpeur oublie de prévoir de rendre le message copiable) ou pour des listes de fichiers finder.

Gratos, naturellement, vous connaissez mieux?

Ce message a été modifié par Laszlo Lebrun - 11 Jan 2022, 04:17.


--------------------
"Les gens douteront toujours de la vérité sur Internet car l'erreur est constamment prêchée autour de nous" Johann Wolfgang von Goethe
MBP 15" 2014 Retina ( Win11 + Mojave), Macbook Air 2013 (en voyage), iMac 2015 27" Retina (Mojave + Win11), Macbook blanc 2008 (Mate), pour ne citer que les Macs.
Go to the top of the page
 
+Quote Post
Phil J. Fry
posté 11 Jan 2022, 05:14
Message #8


The Original Martian & DBCM
*****

Groupe : Modérateurs
Messages : 6 552
Inscrit : 25 May 2004
Lieu : sɹɐɯ ⅋ ʞɹoʎ ʍǝu ʍǝu ⅋ ǝssᴉns
Membre no 19 190



Pour les amateurs de Python (dont je suis) il y a pytesseract , un "wrapper" Python3 de tesseract.


--------------------
MBP 16" Sonoma 14.4.1 MBA 13" Sonoma 14.4.1 MacBook Air 11" 10.9.5 MacBook 2Ghz 1Go X.6.4 blanc Mac Mini 1.25Ghz 1Go X.4.10 Spatule de 10,5 cm iPod shuffle 512 iPod mini 4GB iPod Nano 16GB
DBCM III Disciple du MSV Team BOINC Macbidouille
But I'm a creep, I'm a weirdo - What the hell am I doin here? - I don't belong here Radiohead
Il vaut mieux mobiliser son intelligence sur des conneries que mobiliser sa connerie sur des choses intelligentes - S'il n'y a pas de solution, c'est qu'il n'y a pas de problème - Devises Shadok
La connaissance, c'est savoir que la tomate est un fruit. La sagesse, c'est savoir qu'il ne faut pas la mettre dans une salade de fruit. B O'D
Go to the top of the page
 
+Quote Post
Guest_Neutral_ch_*
posté 11 Jan 2022, 08:14
Message #9





Guests






Mais que font les Avengers?
Go to the top of the page
 
+Quote Post
baron
posté 11 Jan 2022, 08:32
Message #10


Macbidouilleur d'Or !
*****

Groupe : Modérateurs
Messages : 19 353
Inscrit : 22 Jul 2004
Lieu : Louvain-la-Neuve (Gaule Gelbique)
Membre no 21 291



Citation (Neutral_ch @ 11 Jan 2022, 08:14) *
Mais que font les Avengers?


huh.gif blink.gif unsure.gif unsure.gif


--------------------
MacBook Pro 14’’ 2021, M1 Pro, 16 Go/1 To – macOS  12.6 “Monterey”  MacBook Pro 15’’ mi-2010 Core i5 2,53 GHz, 8 Go/SSD Samsung 860EVO 1 To – Mac OSX 10.6.8  Power Macintosh G3 beige de bureau, rev.1 @ 233MHz, 288 Mo/4Go – MacOS 9.1 — + carte PCI IDE/ATA Tempo 66 Acard 6260 avec HD interne Maxtor 80 Go + graveur interne CDRW/DVD LG GCC-4520B + tablette A4 Wacom UD-0608-A + LaCie ElectronBlueIV 19" + HP ScanJet 6100C   B-Box 3 + HP LaserJet 4000 N  
La recherche dans MacBidouille vous paraît obscure ? J'ai rédigé une proposition de FAQ. Le moteur logiciel a un peu changé depuis mais ça peut aider quand même.
Les corsaires mettent en berne…
Go to the top of the page
 
+Quote Post
Guest_Neutral_ch_*
posté 11 Jan 2022, 08:37
Message #11





Guests






Citation (baron @ 11 Jan 2022, 08:32) *
Citation (Neutral_ch @ 11 Jan 2022, 08:14) *
Mais que font les Avengers?


huh.gif blink.gif unsure.gif unsure.gif

Hooo tu me deçois Baron tongue.gif mais c'est le matin, je te pardonne.

Tesseract
Go to the top of the page
 
+Quote Post
Laszlo Lebrun
posté 11 Jan 2022, 09:18
Message #12


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 2 188
Inscrit : 1 Nov 2021
Membre no 214 848



Citation (Phil J. Fry @ 11 Jan 2022, 05:14) *
Pour les amateurs de Python (dont je suis) il y a pytesseract , un "wrapper" Python3 de tesseract.


Tu serais capable de faire en python avec ca une appli qui "pompe" chaque seconde une valeur d'une page web par un simple lasso rectangulaire et la sort en texte?


--------------------
"Les gens douteront toujours de la vérité sur Internet car l'erreur est constamment prêchée autour de nous" Johann Wolfgang von Goethe
MBP 15" 2014 Retina ( Win11 + Mojave), Macbook Air 2013 (en voyage), iMac 2015 27" Retina (Mojave + Win11), Macbook blanc 2008 (Mate), pour ne citer que les Macs.
Go to the top of the page
 
+Quote Post
Phil J. Fry
posté 11 Jan 2022, 16:40
Message #13


The Original Martian & DBCM
*****

Groupe : Modérateurs
Messages : 6 552
Inscrit : 25 May 2004
Lieu : sɹɐɯ ⅋ ʞɹoʎ ʍǝu ʍǝu ⅋ ǝssᴉns
Membre no 19 190



Ça dépasse de loin mes compétences laugh.gif


--------------------
MBP 16" Sonoma 14.4.1 MBA 13" Sonoma 14.4.1 MacBook Air 11" 10.9.5 MacBook 2Ghz 1Go X.6.4 blanc Mac Mini 1.25Ghz 1Go X.4.10 Spatule de 10,5 cm iPod shuffle 512 iPod mini 4GB iPod Nano 16GB
DBCM III Disciple du MSV Team BOINC Macbidouille
But I'm a creep, I'm a weirdo - What the hell am I doin here? - I don't belong here Radiohead
Il vaut mieux mobiliser son intelligence sur des conneries que mobiliser sa connerie sur des choses intelligentes - S'il n'y a pas de solution, c'est qu'il n'y a pas de problème - Devises Shadok
La connaissance, c'est savoir que la tomate est un fruit. La sagesse, c'est savoir qu'il ne faut pas la mettre dans une salade de fruit. B O'D
Go to the top of the page
 
+Quote Post
Fars
posté 11 Jan 2022, 18:11
Message #14


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 10 235
Inscrit : 4 Nov 2002
Lieu : Carcassonne
Membre no 4 494



Testé sur Pi4 ça fonctionne pas mal smile.gif
Je vais me pencher sur Normcap, pour le moment ça coince a l'install tongue.gif

Edit:Apres installation de xclip a la main, Normcap fonctionne sur Pi4.
Plutôt pas mal ça peut dépanner effectivement smile.gif
Et voili, intégration de Normcap dans la barre de Menu de mon Pi4 smile.gif
Accès en un clic.


Edit: après utilisation régulièrement depuis, pour récupérer avec un utilitaire qui m’affiche des infos en temps réel sur mon fond d’écran, l’ocr a du mal à interpréter les données.
Ocr et assistants vocaux mêmes combat.
Ça marche, mais toujours dans certaines conditions, mais ça fait jamais de miracles.

Ce message a été modifié par Fars - 15 Jan 2022, 08:29.


--------------------
Raspberry Pi5 8Go Ram / Dissipateur thermique et ventilo / PIMORONI NVMe BASE PCIe 3.0 / SSD NVMe M.2 Crucial P3 PLUS 500Go
Raspberry Pi4 B (Overclock 2.0 Ghz) / 4 Go Ram / SSD Samsung T5 500 Go Usb3 / Ventila Pi4 / Raspberry Pi OS (Buster) / boot SD Card / rootfs SSD (fait accessoirement office de serveur pour Apple TV 4K 128Go)
Raspberry Pi4 B / 2 Go Ram/ SD 16Go / RETROFLAG NESPI 4 Case / Recalbox 7.2 / Kodi 18 / 8BitDo SN30 Pro+ Pac Man et 1942
MacBook 6,1 2009 / 8 Go Ram Corsair /SSD Crucial 500MX 500 Go SATA / (Single boot) Ubuntu 18.04.4 LTS (Bionic Beaver) Support 10 ans
MacBook Pro 8,1 2011 / 8 Go Ram Corsair /SSD Crucial 500MX 500 Go SATA / (Single boot) Ubuntu 18.04.4 LTS (Bionic Beaver) Support 10 ans
HP X360 (LORdi) 2015 / 4 Go Ram / SSD 250 Go M2 / (Single boot) Ubuntu 20.04 LTS (Focal Fossa) Support 10 ans
HP Laptop 17 Core i3-11th gen 3.00GHz x 4 / 8 Go Ram / SSD 512 Go / (Single boot) Zorin 16.3
Apple TV 4K 128Go / 8BitDo SN30 Pro+
Je remercie la fondation Raspberry qui me redonne une ame d'enfant avec un ordinateur, comme Apple avait su le faire dans les années 80.
Trek Emonda SL6 pour le plaisir, pour s'amuser et se faire mal :) Ultegra 50x34/11x28, Ksyrium Pro, Keo Blade Carbon, Edge 520Plus, GP5000. Vittoria Rubino Pro G2
Go to the top of the page
 
+Quote Post
frankie00
posté 26 Dec 2023, 07:23
Message #15


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 1 947
Inscrit : 22 Dec 2011
Lieu : Paris
Membre no 173 181



installé normcap, il se lance normalement via Terminal
Mais en sélectionnant une fenêtre de safari, normalement un liséré rouge doit apparaître tout autour de la fenêtre d'après la doc.
Or c'est pas le cas


--------------------
¶ Mon blog informatique est la Vague en Creux
¶ MacBook Pro de 2021 avec OS 14.4 Sonoma, 13 pouces, 16 Go de mémoire RAM, processeur M1, SSD de 500Go
¶ Autre MacBook Pro de 2015 avec OS 10.14.5 Mojave 15 pouces Retina, 16 Go de mémoire RAM, processeur quadri-core 2.5 GHz Intel Core , double carte graphique et SSD 512 Go
Nous sommes 2 sur ce site: Jean Pass & Dem Eilleur qui vous saluons bien !“
Go to the top of the page
 
+Quote Post
Laszlo Lebrun
posté 26 Dec 2023, 09:35
Message #16


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 2 188
Inscrit : 1 Nov 2021
Membre no 214 848



Citation (Laszlo Lebrun @ 11 Jan 2022, 09:18) *
Citation (Phil J. Fry @ 11 Jan 2022, 05:14) *
Pour les amateurs de Python (dont je suis) il y a pytesseract , un "wrapper" Python3 de tesseract.


Tu serais capable de faire en python avec ca une appli qui "pompe" chaque seconde une valeur d'une page web par un simple lasso rectangulaire et la sort en texte?


Update: je suis allé voir les gentils hackers du Chaos Computer Club, mon idée leur a plu. Ils s'y sont pris autrement, mais j'ai mon programme Python qui ronronne.
tongue.gif

Citation (frankie00 @ 26 Dec 2023, 07:23) *
installé normcap, il se lance normalement via Terminal
Mais en sélectionnant une fenêtre de safari, normalement un liséré rouge doit apparaître tout autour de la fenêtre d'après la doc.
Or c'est pas le cas

Ça marche pour les autres applis?
Est ce que tu a donné les autorisations a Normcap?


--------------------
"Les gens douteront toujours de la vérité sur Internet car l'erreur est constamment prêchée autour de nous" Johann Wolfgang von Goethe
MBP 15" 2014 Retina ( Win11 + Mojave), Macbook Air 2013 (en voyage), iMac 2015 27" Retina (Mojave + Win11), Macbook blanc 2008 (Mate), pour ne citer que les Macs.
Go to the top of the page
 
+Quote Post
frankie00
posté 26 Dec 2023, 12:36
Message #17


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 1 947
Inscrit : 22 Dec 2011
Lieu : Paris
Membre no 173 181



Citation (Laszlo Lebrun @ 26 Dec 2023, 09:35) *
...
Citation (frankie00 @ 26 Dec 2023, 07:23) *
installé normcap, il se lance normalement via Terminal
Mais en sélectionnant une fenêtre de safari, normalement un liséré rouge doit apparaître tout autour de la fenêtre d'après la doc.
Or c'est pas le cas

Ça marche pour les autres applis?
Est ce que tu a donné les autorisations a Normcap?

Ça marche super bien: il suffisait d'autoriser les notifications pythons
Je sens que ça va me servir ce truc, merci


--------------------
¶ Mon blog informatique est la Vague en Creux
¶ MacBook Pro de 2021 avec OS 14.4 Sonoma, 13 pouces, 16 Go de mémoire RAM, processeur M1, SSD de 500Go
¶ Autre MacBook Pro de 2015 avec OS 10.14.5 Mojave 15 pouces Retina, 16 Go de mémoire RAM, processeur quadri-core 2.5 GHz Intel Core , double carte graphique et SSD 512 Go
Nous sommes 2 sur ce site: Jean Pass & Dem Eilleur qui vous saluons bien !“
Go to the top of the page
 
+Quote Post

Reply to this topicStart new topic
1 utilisateur(s) sur ce sujet (1 invité(s) et 0 utilisateur(s) anonyme(s))
0 membre(s) :

 



Nous sommes le : 24th April 2024 - 23:58