Accueil

Transformation PDF -> PDF indexage

Vous êtes ici

1 contribution / 0 nouveau(x)
Transformation PDF -> PDF indexage

Hello,

Je désire utiliser un programme externe pour transformer mes PDF (ou TIFF) en PDF indexables. Je peux soit développer une action (et démarrer commande externe) ou utiliser les "transformers".
Il semble qu'une transformation semble plus simple pour ce qu'il y a à faire. Il y a un exemple ici (http://wiki.alfresco.com/wiki/Tiger_OCR_integration) à adapter selon (http://wiki.alfresco.com/wiki/Content_Transformations).

Je désire transformer directement le fichier venant vers sa forme PDF indexable. Cependant il n'y a que "Transform and copy..." dans la liste de actions. Dois-je faire une combine spécial ? (copier dans un autre répertoire, supprimer l'originale, ...)

En ce qui concerne le web-client-custom.xml, voici les lignes ajoutées. Comment puis-je personnaliser ce transformer ? Car si je crée une action, choisi "Transform and copy..." je vois deux fois dans la liste la transformation en PDF. Puis-je mettre un nom spécifique ?

<config evaluator="string-compare" condition="Action Wizards" replace="false">
<transformers>
<transformer name="application/pdf"/>
</transformers>
</config>

Je vais utiliser le moteur d'Abbyy (http://www.ocr4linux.com). Quelqu'un a-t-il déjà fait cette transformation ?
(j'ai trouvé ceci : http://groups.google.com/group/abbyy-ocr-for-linux/browse_thread/thread/f2b9731c9260e0bf/2d526454a3ea69a8?lnk=gst&q=context#2d526454a3ea69a8)

Merci bien :-)

If you have best pratices or find good documentation to do a feature, add a link here : http://wiki.alfresco.com/wiki/How_to