IPB

Bienvenue invité ( Connexion | Inscription )

> tesseract, un puissant OCR en ligne de commande
Options
fgiron
posté 10 Jan 2022, 11:07
Message #1


Macbidouilleur de vermeil !
****

Groupe : Membres
Messages : 1 342
Inscrit : 19 May 2003
Lieu : Vendée
Membre no 7 668



Bonjour,

À la recherche, il y a quelques semaines, d'un logiciel OCR, et ne trouvant pas satisfaction dans ce que propose l'Apple Store, l'idée me vint alors qu'il pût en exister en ligne de commande. Quelle bien m'en a pris.
J'ai trouvé tesseract dans la liste des paquets MacPort, et j'ai pu en expérimenter l'incroyable puissance.
À partir de scan pas parfaitement nets pris avec Scannable sur un vieil iPhone 4S envoyés sur mon iMac, le résultat dépasse tout ce que j'ai pu connaître auparavant. Sur quatre pages de texte, une seule erreur.
Il faut installer le paquet tesseract, puis les langues, au minimum l'anglais — tesseract-eng — et le français — tesseract-fra (sans l'anglais, ça ne fonctionne pas, à ce que j'ai pu observer).

Code
port list tesseract                                                            
tesseract                      @4.1.3          textproc/tesseract
tesseract --list-langs                                                          
List of available languages (4):
deu
eng
fra
grc


Voici la commande, en précisant en options la résolution de l'image et la langue:

Code
tesseract Source Cible --dpi 72 -l fra


En espérant que ce petit OCR en ligne de commande sera utile à quelques uns.

Ce message a été modifié par fgiron - 10 Jan 2022, 11:10.


--------------------
iMac 24", M1, 1To, 16 Go, Sonoma 14.6.1
iMac 24', M1, 1 To, 8 Go, Sonoma 14.6.1
Airport Express 7.6.1 - Time Capsule 2 To 7.6.1 - iPod classic 160 G
Go to the top of the page
 
+Quote Post
 
Start new topic
Réponse(s)
baron
posté 11 Jan 2022, 01:42
Message #2


Macbidouilleur d'Or !
*****

Groupe : Modérateurs
Messages : 20 058
Inscrit : 22 Jul 2004
Lieu : Louvain-la-Neuve (Gaule Gelbique)
Membre no 21 291



Ça semble bien travailler offline.

On trouve la doc ici :
https://tesseract-ocr.github.io/tessdoc/ (Remarquable ! Le chapitre sur l'amélioration de l'OCRsleep.gif )

Et le logiciel :
https://github.com/tesseract-ocr/tesseract/


--------------------
MacBook Pro 14’’ 2021, M1 Pro, 16 Go/1 To – macOS  12.6 “Monterey”  MacBook Pro 15’’ mi-2010 Core i5 2,53 GHz, 8 Go/SSD Samsung 860EVO 1 To – Mac OSX 10.6.8  Power Macintosh G3 beige de bureau, rev.1 @ 233MHz, 288 Mo/4Go – MacOS 9.1 — + carte PCI IDE/ATA Tempo 66 Acard 6260 avec HD interne Maxtor 80 Go + graveur interne CDRW/DVD LG GCC-4520B + tablette A4 Wacom UD-0608-A + LaCie ElectronBlueIV 19" + HP ScanJet 6100C   B-Box 3 + HP LaserJet 4000 N  
La recherche dans MacBidouille vous paraît obscure ? J'ai rédigé une proposition de FAQ. Le moteur logiciel a un peu changé depuis mais ça peut aider quand même.
Les corsaires mettent en berne…
Go to the top of the page
 
+Quote Post
Laszlo Lebrun
posté 11 Jan 2022, 04:15
Message #3


Macbidouilleur d'Or !
*****

Groupe : Membres
Messages : 2 791
Inscrit : 1 Nov 2021
Membre no 214 848



Citation (baron @ 11 Jan 2022, 01:42) *

Merci,

Ca m'a permis de trouver cela:

https://github.com/dynobo/normcap

Un logiciel génial, basé sur Tesseract, qui fait un OCR sur une partie de l'écran et met le résultat dans le presse-papiers.
Absolument utile pour la sauvegarde des messages d'erreurs (ou chaque fois le developpeur oublie de prévoir de rendre le message copiable) ou pour des listes de fichiers finder.

Gratos, naturellement, vous connaissez mieux?

Ce message a été modifié par Laszlo Lebrun - 11 Jan 2022, 04:17.


--------------------
"Les gens douteront toujours de la vérité sur Internet car l'erreur est constamment prêchée autour de nous" Johann Wolfgang von Goethe
MBP 15" 2015 Retina ( Win11, Sequoia), Macbook Air 2015 ( Win11, en voyage), iMac 2015 27" Retina (Win11,Sequoia), MacbookPro 2012 (Linux) pour le piano... pour ne citer que les Macs.
Go to the top of the page
 
+Quote Post

Les messages de ce sujet


Reply to this topicStart new topic
2 utilisateur(s) sur ce sujet (2 invité(s) et 0 utilisateur(s) anonyme(s))
0 membre(s) :

 



Nous sommes le : 18th September 2025 - 14:01