Recognition des Character Optical Character Recognition (OCR)
Transformer l’analogique en numérique!
OCR ou Optical Character Recognition (reconnaissance optique des signes en langue allemande) décrit une technologie qui peut créer des fichiers texte à partir de fichiers grilles/images tels que PDF, JPG, etc. La conversion permet d’utiliser les données obtenues pour le traitement ultérieur ou l’automatisation de processus tels que le traitement des factures.
Point sur l’état d’avancement
Le RCO est une technologie de base pour de nombreux programmes traitant du traitement des documents. Cette technologie permet de numériser et de traiter les documents disponibles sur support papier. De ce fait, la transmission par analogie est supprimée par l’abaissement de documents pertinents. Les pièces de papier composées exclusivement de la machine peuvent déjà être entièrement numérisées avec une très grande fiabilité. Le RCO, entre autres, sert de base aux systèmes de gestion des documents pour permettre le traitement ultérieur et l’automatisation des documents papier, tels que les factures ou les bons de livraison.
Comment fonctionne le RCO?
La technologie du RCO se caractérise principalement par la reconnaissance des modèles. Ainsi, elle subdivise le fichier image en différentes catégories. On distingue les graphiques, les tableaux et les blocs de texte. Une fois que le programme a identifié un bloc de texte, l’étape suivante consiste à analyser les différentes lettres. Pour l’ordinateur, ces lettres ne sont que des regroupements de pixels avec lesquels il ne peut pas encore fonctionner. Le programme reconnaît ces groupements (OCR) et les recoupe avec des bases de données existantes et les transforme en caractères. Afin d’améliorer la reconnaissance des textes manuscrits, les regroupements seront ensuite recoupés au niveau des caractères (ICR) et au niveau des mots (IWR) à partir d’une autre base de données.
Reconnaissance intelligente du Character Recognition
La reconnaissance intelligente du Character Recognition (ICR) décrit la correction d’erreur au niveau des caractères. Il s’agit ainsi de vérifier si le signe reconnu a un sens dans le contexte du mot. À titre d’exemple, on peut citer les signes «O» et «0» (zéro) ou «B» et «8», qui peuvent facilement être confondus. Le chiffre 0 pourrait être reconnu dans le mot «Oder» et remplacé par le RIC par la lettre «O».
Recognition Word intelligente
La recommandation intelligente Word Recognition (IWR) décrit la correction d’erreur au niveau du mot. En particulier dans le cas de textes écrits à la main, il peut arriver que les différents signes ne soient pas reconnaissables par la technologie du RCO. Ainsi, IWR compare les caractéristiques mondiales du mot avec une base de données de mots afin d’augmenter le taux d’identification correct.
Mise en œuvre progressive
Étape 1: Infrastructures techniques
Étape 2: Trier les documents papier
Étape 3: Numériser les documents
Étape 4: Transformation assistée par logiciel des fichiers
Possibilités pour les PME
Contactez
Utilisez notre radar technologique pour suivre les principales technologies pertinentes pour les PME!