OCR, extraire du texte d’une image ou d’un fichier PDF

OCR, extraire du texte d’une image ou d’un fichier PDF

La reconnaissance optique de caractères (OCR), ou océrisation, est plus simplement appelée reconnaissance de texte. Un programme OCR extrait et réutilise les données des documents numérisés, des images d’appareils photo et des fichiers PDF contenant uniquement des images. Le logiciel OCR distingue les lettres sur l’image, les met en mots, puis met les mots en phrases, permettant ainsi l’accès et l’édition du contenu original. Il élimine également le besoin de saisie manuelle des données.

gImageReader , un logiciel OCR gratuit

gImageReader est un logiciel gratuit et libre, sous licence GNU GPL V3, disponible sur Windows et Linux, qui permet d’extraire du texte d’une image ou d’un fichier PDF. Vous pourrez ensuite copier le texte extrait de l’image pour le coller dans votre éditeur de texte préféré, comme Word, OnlyOffice ou LibreOffice.

Le fonctionnement est simple. Vous importez l’image ou le fichier PDF dans gImageReader, vous sélectionnez sur l’image et avec l’aide de votre souris le texte à extraire, puis vous cliquez sur « Reconnaître la sélection ». Le texte à copier s’affiche instantanément dans le panneau de droite.

Caractéristiques de gImageReader

Source : https://github.com/manisandro/gImageReader
Télécharger le logiciel : https://github.com/manisandro/gImageReader/releases

Sur Linux, il faudra aussi installer « tesseract-ocr » et le pack de langue souhaité « tesseract-ocr-fra » (pour le français).

À lire aussi

Comment fonctionnent les robots d’exploration et d’indexation ?
Comment fonctionnent les robots d’exploration et d’indexation ?Comment les robots d’exploration crawlers naviguent le web ? Découvrez comment donner à votre site ...
Conseils pour corriger l’erreur 404
Conseils pour corriger l’erreur 404Comment et pourquoi corriger une erreur 404 ? Savoir corriger ces erreurs est crucial pour votre site ...
Pourquoi utiliser la Loi de Brandolini dans vos articles de blog ?
Pourquoi utiliser la Loi de Brandolini dans vos articles de blog ?Qu’est-ce que la Loi de Brandolini ? La Loi de Brandolini a été conceptualisée par l’informaticien ...
Retrouvons-nous sur LinkedIn