Transformation PDF image en PDF plein texte

cancel
Showing results for 
Search instead for 
Did you mean: 
calamarz
Member II

Transformation PDF image en PDF plein texte

Bonjour,

Nous avons des scanners et photocopieurs qui permettent la numerisation vers FTP/SMB etc…

Je viens de faire des essais et j'arrive bien a numériser les documents PDF directement dans l'arborescence Alfresco mais n'ayant pas de logiciels OCR je me retrouve avec un PDF "image" ainsi la recherche plein texte d'Alfresco ne fonctionne-t-elle pas.

Apres des recherches, je viens de trouver chez l'editeur ABBYY un logiciel windows qui permet de faire de l'OCR sur un pdf image afin de le transformer en pdf plein texte, cela fonctionne assez bien, mais ma question est la suivante existe-il sous linux un logiciel OCR pour faire cette meme manipulation ??? (je sais qu'il existe un client chez ABBYY linux mais le systeme de licence ne me plait pas).

Merci d'avance,

Cdlt
2 Replies
calamarz
Member II

Re: Transformation PDF image en PDF plein texte

J'ai aussi suivi un tuto utilisant pdfocr mais apres installation le resultat est véritablement pas terrible (http://ubuntuforums.org/showthread.php?t=1456756&page=1
dranakan
Active Member

Re: Transformation PDF image en PDF plein texte

Hello,

Il y a plusieurs mois j'avais fait quelques recherches mais je n'avais trouvé que le Abbyy Finereader Engine http://www.abbyy.com/ocr_sdk_linux/ pour une conversion OCR fonctionnant sur Linux.