OCR, extraire du texte d’une image ou d’un fichier PDF

OCR, extraire du texte d’une image ou d’un fichier PDF

La reconnaissance optique de caractères (OCR), ou océrisation, est plus simplement appelée reconnaissance de texte. Un programme OCR extrait et réutilise les données des documents numérisés, des images d’appareils photo et des fichiers PDF contenant uniquement des images. Le logiciel OCR distingue les lettres sur l’image, les met en mots, puis met les mots en phrases, permettant ainsi l’accès et l’édition du contenu original. Il élimine également le besoin de saisie manuelle des données.

gImageReader , un logiciel OCR gratuit

gImageReader est un logiciel gratuit et libre, sous licence GNU GPL V3, disponible sur Windows et Linux, qui permet d’extraire du texte d’une image ou d’un fichier PDF. Vous pourrez ensuite copier le texte extrait de l’image pour le coller dans votre éditeur de texte préféré, comme Word, OnlyOffice ou LibreOffice.

Le fonctionnement est simple. Vous importez l’image ou le fichier PDF dans gImageReader, vous sélectionnez sur l’image et avec l’aide de votre souris le texte à extraire, puis vous cliquez sur « Reconnaître la sélection ». Le texte à copier s’affiche instantanément dans le panneau de droite.

Caractéristiques de gImageReader

Source : https://github.com/manisandro/gImageReader
Télécharger le logiciel : https://github.com/manisandro/gImageReader/releases

Sur Linux, il faudra aussi installer « tesseract-ocr » et le pack de langue souhaité « tesseract-ocr-fra » (pour le français).

À lire aussi

Stable Diffusion sur Photoshop avec un plugin AUTOMATIC1111
Stable Diffusion sur Photoshop avec un plugin AUTOMATIC1111Utiliser AUTOMATIC1111 sur Photoshop avec ce plugin étend les incroyables possibilités de Stable ...
Comment créer des images avec l’IA (Intelligence Artificielle) ?
Comment créer des images avec l’IA (Intelligence Artificielle) ?Plongez dans le monde fascinant des outils en ligne et logiciels qui utilisent l'intelligence ...
Pourquoi utiliser la Loi de Brandolini dans vos articles de blog ?
Pourquoi utiliser la Loi de Brandolini dans vos articles de blog ?Qu’est-ce que la Loi de Brandolini ? La Loi de Brandolini a été conceptualisée par l’informaticien ...
Retrouvons-nous sur LinkedIn