Sujet : automatiser l'ocr de fichiers en pdf

Chers amis, voici mon problème :

J'ai un dossier rempli de 6000 fichiers au format pdf. Je souhaiterais rendre chacun de ces fichiers "searchable" et je dois donc envoyer un OCR dessus.

C'est chiant, long et je n'ai pas d'esclave sous la main.

Est-il possible d'automatiser ce processus ? Le batch serait : 1/ ouverture du fichier x.pdf  2/ OCR dudit fichier 3/ enregistrement du fichier "searchable" sous x.pdf en remplacement du précédent 4/ passage à y.pdf   ad lib

Merci de vos conseils à base de Linux et leds.

La bise affectueuse.

http://www.bettercallsaul.com/

N'imprimer ce message que si nécessaire, pensez à l'environnement

2

Re : automatiser l'ocr de fichiers en pdf

Passe sous windaube

Re : automatiser l'ocr de fichiers en pdf

de micro$oft tu veux dire?

http://www.bettercallsaul.com/

N'imprimer ce message que si nécessaire, pensez à l'environnement

Re : automatiser l'ocr de fichiers en pdf

t'as pas un IT capable de te faire une macro VB en 20 secondes ?

ton soft OCR n'a pas un système de batch

5

Re : automatiser l'ocr de fichiers en pdf

Ma société peut vous proposer une solution pour la somme modique de 2000€.

Le véritable asile, un site de pères de familles qui mangent du fenouil.

Re : automatiser l'ocr de fichiers en pdf

non
non
non

http://www.bettercallsaul.com/

N'imprimer ce message que si nécessaire, pensez à l'environnement

7 Dernière modification par Conrad (29-08-2012 12:29:22)

Re : automatiser l'ocr de fichiers en pdf

Pour quelqu'un qui facture des fortunes à l'heure, tu aurais du calculer que c'était plus rentable que le temps que tu vas passer à ne pas trouver la solution.

Le véritable asile, un site de pères de familles qui mangent du fenouil.

Re : automatiser l'ocr de fichiers en pdf

Est-ce négociable?

http://www.bettercallsaul.com/

N'imprimer ce message que si nécessaire, pensez à l'environnement

9

Re : automatiser l'ocr de fichiers en pdf

Bien sur mais la promo étant maintenant terminée, le prix de départ est 3000€ avec un support de une semaine.

Le véritable asile, un site de pères de familles qui mangent du fenouil.

10

Re : automatiser l'ocr de fichiers en pdf

va te faire enculer.

http://www.bettercallsaul.com/

N'imprimer ce message que si nécessaire, pensez à l'environnement

11 Dernière modification par Trax (29-08-2012 12:42:21)

Re : automatiser l'ocr de fichiers en pdf

Sous linux un truc en deux lignes dans le style :

find . -iname "*.pdf" -execdir convert {} {}.png \;
find . -name "*.png" -execdir gocr -i {} -o {}.txt \;

devrait suffire.

La route ? Là où on va, on n’a pas besoin de route !

12 Dernière modification par velvetu (29-08-2012 13:23:57)

Re : automatiser l'ocr de fichiers en pdf

le fait est que je suis sous 7.

Mais merci quand même.

http://www.bettercallsaul.com/

N'imprimer ce message que si nécessaire, pensez à l'environnement

Re : automatiser l'ocr de fichiers en pdf

Installe linux.
Et pour une fois ce conseil est relativement utile !

SojaMoule : "Tu perds ton temps, c'est l'asile et je t'emmerde. Dans ta forteresse de certitudes apprises à l'école ou dans tes lectures, tu n'es pas le dépositaire de la vérité absolue."
Reblochon : "As-tu quelque chose d'intéressant et constructif à dire  ? Oui ? Lâche toi ! Non ? TA PUTAIN DE GUEULE D'ATTARDÉ, tu la fermes. Bisous"

14

Re : automatiser l'ocr de fichiers en pdf

http://france.abbyy.com/finereader/

15 Dernière modification par Kane (29-08-2012 13:37:27)

Re : automatiser l'ocr de fichiers en pdf

Tu peux le faire avec l'imprimante virtuelle d'office, mais c'est PAS fiable du tout.

http://office.microsoft.com/en-us/help/ … 77103.aspx

Tu imprimes dans un fichier et tu utilise la fonction OCR de l'outil de scan sur ce fichier.

16

Re : automatiser l'ocr de fichiers en pdf

velvetu a écrit:

le fait est que je suis sous 7.

Ah, il suffit donc juste d'installer un logiciel te feras ça gratis en t'installant une toolbar.

Sur mac evidemment il suffira d'envoyer une photo de ton trou de bal à apple accompagné d'un cheque de 9.90€

C'est pas merveilleux la vie ?

La route ? Là où on va, on n’a pas besoin de route !

17

Re : automatiser l'ocr de fichiers en pdf

les logiciels pour ocr je connais, mais c'est le caractère automatique du truc que je ne parviens pas à trouver.

Bon c'est pas grave sinon

http://www.bettercallsaul.com/

N'imprimer ce message que si nécessaire, pensez à l'environnement

18

Re : automatiser l'ocr de fichiers en pdf

http://korben.info/faire-de-locr-gratui … -docs.html

Et le turc sinon : http://code.google.com/p/tesseract-ocr/downloads/list

19

Re : automatiser l'ocr de fichiers en pdf

Sinon (et si tu peux) tu l'envoie sur Google doc connard

20

Re : automatiser l'ocr de fichiers en pdf

noway a écrit:

Sinon (et si tu peux) tu l'envoie sur Google doc connard

Tu n'as lu qu'une partie de ma question : OCR

et tu as oublié l'autre partie, la plus importante : automatiser.

Merci de rebooter ton ordinateur et d'oublier ce site.

http://www.bettercallsaul.com/

N'imprimer ce message que si nécessaire, pensez à l'environnement

21

Re : automatiser l'ocr de fichiers en pdf

Non mais les bons logiciels du genre n'ont pas une fonction batch d'office? Ça existe depuis que j'ai un PC dans photoshop le traitement par lot...

Re : automatiser l'ocr de fichiers en pdf

http://www.allyoulike.com/25727/nuance- … fessional/

23

Re : automatiser l'ocr de fichiers en pdf

Purée, même avec adblock on dirait que ce site est une blague.

http://upix.fr/i/2012/08/29/gB62D.png

La route ? Là où on va, on n’a pas besoin de route !

Re : automatiser l'ocr de fichiers en pdf

Les liens Rapidshare sont bons par contre.

25

Re : automatiser l'ocr de fichiers en pdf

Powershell
C'est le shell Windows moderne.

5 lignes de script. Je te laisse chercher un peu, là je suis hélas occupé.

su-per