La technologie OCR : L’Art de la Reconnaissance de Texte

OCR signification

Qu’est-ce que l’OCR ?

L’OCR, ou Reconnaissance Optique de Caractères (en anglais, Optical Character Recognition), est une technologie qui permet de convertir des images de texte en texte numérique. Cette technologie est utilisée pour transformer des documents scannés, des photos de documents ou des PDF en données éditables et recherchables par ordinateur. L’OCR facilite ainsi l’exploitation de contenu textuel provenant de sources physiques ou d’images numériques.

Quelques exemples très concrets :

  • Extraction des données relatives à une facture
  • Lecture automatique des contacts inscrit sur une carte de visite
  • Lecture des informations présentes sur une carte vitale
  • Lecture d’un RIB reçu en version PDF

Dans ces quatre exemples, grâce à la technologie OCR, il est possible pour un logiciel de lire des données issues de ces documents et ainsi d’utiliser les données lues pour réaliser des actions :

  • Ajout des montants de la facture à votre comptabilité
  • Ajout des contacts à votre répertoire ou base de données fournisseurs
  • Vérification de l’identité d’une personne grâce à son numéro de carte vitale
  • Virement vers le RIB lu par l’OCR

Chacune de ces actions est du travail en moins pour les personnes utilisant un OCR.

Acteurs de la technologie OCR

L’OCR repose sur des algorithmes avancés pour identifier et extraire le texte présent dans une image. Un grand nombre acteurs existent sur le marché, en voici plusieurs français :

  • Mindee : disponible en open source !
  • Ubiai
  • Kili
  • SmartRoby de Novelis
  • Pas français mais open source et largement utilisé par un grand nombre de solutions : Tesseract utilisé notamment par Google

De plus, un grand nombres de logiciels et application mobile propose des fonctionnalités basées sur la technologie OCR. Notamment les logiciels de comptabilité et de gestion de compte en banque qui permettent à leurs clients d’enregistrer des RIBs ou des factures à partir d’une simple photo.

D’autres acteurs peuvent vérifier les documents d’identité des clients à partir de votre carte d’identité ou passeport ; une simple photo et l’OCR pourra extraire toutes les données et précéder à la vérification. Cette technologie est souvent utilisée par des solutions de trading ou de banque en ligne.

Conclusion

En clair, la technologie OCR est un outil supplémentaire qu’ont les entreprises de développement de logiciels pour automatiser encore un peu plus vos processus internes et tâches répétitives et ainsi gagné en productivité. L’OCR en tant que tel n’apporte que peu d’intérêt, son plein potentiel se révèle lorsque votre OCR se couple avec d’autres fonctionnalités (comptabilité, finance, gestion de stock, … etc).

Chez Snowlab toutes les fonctionnalités que nous développons sont compatibles avec notre OCR permettant d’aller toujours plus loin dans l’optimisation de votre productivité !

Cet article vous a plu ? Partagez-le !

Facebook
Twitter
LinkedIn