04 novembre 2015

ExtractPDF : extraire le texte des fichiers PDF en ligne

Comme son nom l'indique, ExtractPDF est un outil en ligne gratuit qui permet d' extraire les Images, le texte ou des polices de caractères des fichiers PDF. La taille maximale des fichiers à traiter est de 14 Mo.



Certes, on peut faire la même chose à partir de certains logiciels comme Adobe Reader ou A-PDF Text Extractor, mais on n'a pas tout le temps ce qu'il faut sous la main et ExtractPDF est disponible en ligne et en français.

Pour l'utiliser, il suffit de choisir le fichier PDF à traiter puis de le transférer sur ExtractPDF. Ensuite vous lancez le processus et vous pouvez récupérer ce qui vous intéresse (texte ou images) pour l'utiliser dans un autre document.

ExtractPDF
gojcg a dit…

Bonjour,

Une mini remarque : pour ne pas avoir 404 le lien qui fonctionne semble être
http://www.extractpdf.com/fr.html
Merci pour ce service utile

thebloom a dit…

@ gojcg : effectivement ça marche mieux ainsi ;-)

Katryne a dit…

C'est génial, merci de la trouvaille !
Petite précision : ce ne semble pas faire de la reconnaissance de caractères.
Si le pdf est fabriqué à l'aide d'images (par ex. des scans de pages d'un vieux livre), le service en ligne ne recrachera que des images des pages, une par page.

Par contre, pour un pdf créé, mettons, avec Libre Office (textes et images dans un document .doc exporté en pdf), alors le service va donner d'une part toutes les images dans un onglet, l'ensemble étant téléchargeable en zip) et d'un autre côté tout le texte et rien que le texte avec des vraies lettres que l'on peut copier-coller.
En prime, on nous donne aussi des infos sur la réalisation du pdf : fabriqué tel jour avec tel logiciel, Libre-Office, dans l'exemple ci-dessus.

A noter aussi un autre service du même site, pas encore testé : pour vérifier l'orthographe d'un texte complet.

 
Freewares & Tutos © 2015 | Distributed By My Blogger Themes | Designed By Templateism