OCR, extraire du texte d’une image ou d’un fichier PDF

OCR, extraire du texte d’une image ou d’un fichier PDF

La reconnaissance optique de caractères (OCR), ou océrisation, est plus simplement appelée reconnaissance de texte. Un programme OCR extrait et réutilise les données des documents numérisés, des images d’appareils photo et des fichiers PDF contenant uniquement des images. Le logiciel OCR distingue les lettres sur l’image, les met en mots, puis met les mots en phrases, permettant ainsi l’accès et l’édition du contenu original. Il élimine également le besoin de saisie manuelle des données.

gImageReader , un logiciel OCR gratuit

gImageReader est un logiciel gratuit et libre, sous licence GNU GPL V3, disponible sur Windows et Linux, qui permet d’extraire du texte d’une image ou d’un fichier PDF. Vous pourrez ensuite copier le texte extrait de l’image pour le coller dans votre éditeur de texte préféré, comme Word, OnlyOffice ou LibreOffice.

Le fonctionnement est simple. Vous importez l’image ou le fichier PDF dans gImageReader, vous sélectionnez sur l’image et avec l’aide de votre souris le texte à extraire, puis vous cliquez sur « Reconnaître la sélection ». Le texte à copier s’affiche instantanément dans le panneau de droite.

Caractéristiques de gImageReader

Source : https://github.com/manisandro/gImageReader
Télécharger le logiciel : https://github.com/manisandro/gImageReader/releases

Sur Linux, il faudra aussi installer « tesseract-ocr » et le pack de langue souhaité « tesseract-ocr-fra » (pour le français).

À lire aussi

Comment remplacer les banques d’images par l’IA en entreprise ?
Comment remplacer les banques d’images par l’IA en entreprise ?L’intelligence artificielle (IA) ouvre de nouvelles perspectives en matière de création d’images en ...
Comprendre les liens inférés ou liens induits
Comprendre les liens inférés ou liens induitsLes liens inférés (liens induits) marquent une évolution significative en référencement SEO. ...
Comment utiliser la méthode Before-After-Bridge en copywriting ?
Comment utiliser la méthode Before-After-Bridge en copywriting ?La méthode Before-After-Bridge montre le contraste entre l'état actuel et l'état idéal, en ...
Retrouvons-nous sur LinkedIn