IPB

Bienvenue invité ( Connexion | Inscription )

> tesseract, un puissant OCR en ligne de commande
Options
fgiron
posté 10 Jan 2022, 11:07
Message #1


Macbidouilleur de vermeil !
****

Groupe : Membres
Messages : 1 336
Inscrit : 19 May 2003
Lieu : Vendée
Membre no 7 668



Bonjour,

À la recherche, il y a quelques semaines, d'un logiciel OCR, et ne trouvant pas satisfaction dans ce que propose l'Apple Store, l'idée me vint alors qu'il pût en exister en ligne de commande. Quelle bien m'en a pris.
J'ai trouvé tesseract dans la liste des paquets MacPort, et j'ai pu en expérimenter l'incroyable puissance.
À partir de scan pas parfaitement nets pris avec Scannable sur un vieil iPhone 4S envoyés sur mon iMac, le résultat dépasse tout ce que j'ai pu connaître auparavant. Sur quatre pages de texte, une seule erreur.
Il faut installer le paquet tesseract, puis les langues, au minimum l'anglais — tesseract-eng — et le français — tesseract-fra (sans l'anglais, ça ne fonctionne pas, à ce que j'ai pu observer).

Code
port list tesseract                                                            
tesseract                      @4.1.3          textproc/tesseract
tesseract --list-langs                                                          
List of available languages (4):
deu
eng
fra
grc


Voici la commande, en précisant en options la résolution de l'image et la langue:

Code
tesseract Source Cible --dpi 72 -l fra


En espérant que ce petit OCR en ligne de commande sera utile à quelques uns.

Ce message a été modifié par fgiron - 10 Jan 2022, 11:10.


--------------------
[size=1]iMac 24", M1, 1To, 16 Go, Sonoma 14.1
iMac 24', 650 Go, Ram 4 Go, Intel Core 2 Duo 3.06 GHz, OS X 10.10.5
Airport Express 7.6.1 - Time Capsule 2 To 7.6.1 - iPod classic 160 Go
Go to the top of the page
 
+Quote Post

Les messages de ce sujet


Reply to this topicStart new topic
1 utilisateur(s) sur ce sujet (1 invité(s) et 0 utilisateur(s) anonyme(s))
0 membre(s) :

 



Nous sommes le : 12th May 2024 - 07:39