Tous au contenu
La page YouTube s’ouvre dans une nouvelle fenêtreLa page Facebook s’ouvre dans une nouvelle fenêtreLa page LinkedIn s’ouvre dans une nouvelle fenêtreLa page Instagram s’ouvre dans une nouvelle fenêtreLa page RSS s’ouvre dans une nouvelle fenêtre
European Digital Innovation Hub Sarre
European Digital Innovation Hub SarreEuropean Digital Innovation Hub Sarre
  • Rendez-vous & Événements
  • offres
    • Formations
    • Programmes de soutien
    • Meilleures pratiques
    • Webinaire
    • Radar de technologie
  • nouvelles
  • À propos de nous
  • fr_FRFrançais
    • en_GBEnglish (UK)
    • de_DEDeutsch
  • Rendez-vous & Événements
  • offres
    • Formations
    • Programmes de soutien
    • Meilleures pratiques
    • Webinaire
    • Radar de technologie
  • nouvelles
  • À propos de nous
  • fr_FRFrançais
    • en_GBEnglish (UK)
    • de_DEDeutsch

Recognition des Character Optical Character Recognition (OCR)

Transformer l’analogique en numérique!

OCR ou Optical Character Recognition (reconnaissance optique des signes en langue allemande) décrit une technologie qui peut créer des fichiers texte à partir de fichiers grilles/images tels que PDF, JPG, etc. La conversion permet d’utiliser les données obtenues pour le traitement ultérieur ou l’automatisation de processus tels que le traitement des factures.

Prototypes et démonstrateurs présents
Utilisation transsectorielle
Les PME sont-elles adaptées?

Point sur l’état d’avancement

Le RCO est une technologie de base pour de nombreux programmes traitant du traitement des documents. Cette technologie permet de numériser et de traiter les documents disponibles sur support papier. De ce fait, la transmission par analogie est supprimée par l’abaissement de documents pertinents. Les pièces de papier composées exclusivement de la machine peuvent déjà être entièrement numérisées avec une très grande fiabilité. Le RCO, entre autres, sert de base aux systèmes de gestion des documents pour permettre le traitement ultérieur et l’automatisation des documents papier, tels que les factures ou les bons de livraison.

Comment fonctionne le RCO?

La technologie du RCO se caractérise principalement par la reconnaissance des modèles. Ainsi, elle subdivise le fichier image en différentes catégories. On distingue les graphiques, les tableaux et les blocs de texte. Une fois que le programme a identifié un bloc de texte, l’étape suivante consiste à analyser les différentes lettres. Pour l’ordinateur, ces lettres ne sont que des regroupements de pixels avec lesquels il ne peut pas encore fonctionner. Le programme reconnaît ces groupements (OCR) et les recoupe avec des bases de données existantes et les transforme en caractères. Afin d’améliorer la reconnaissance des textes manuscrits, les regroupements seront ensuite recoupés au niveau des caractères (ICR) et au niveau des mots (IWR) à partir d’une autre base de données.

Reconnaissance intelligente du Character Recognition

La reconnaissance intelligente du Character Recognition (ICR) décrit la correction d’erreur au niveau des caractères. Il s’agit ainsi de vérifier si le signe reconnu a un sens dans le contexte du mot. À titre d’exemple, on peut citer les signes «O» et «0» (zéro) ou «B» et «8», qui peuvent facilement être confondus. Le chiffre 0 pourrait être reconnu dans le mot «Oder» et remplacé par le RIC par la lettre «O».

Recognition Word intelligente

La recommandation intelligente Word Recognition (IWR) décrit la correction d’erreur au niveau du mot. En particulier dans le cas de textes écrits à la main, il peut arriver que les différents signes ne soient pas reconnaissables par la technologie du RCO. Ainsi, IWR compare les caractéristiques mondiales du mot avec une base de données de mots afin d’augmenter le taux d’identification correct.

Mise en œuvre progressive

Étape 1: Infrastructures techniques

La technologie OCR peut créer un fichier texte numérique à partir d’une pièce papier. Au préalable, un fichier de grille ou d’image doit être créé à partir du document. Cela se fait au moyen d’un scanner. Les scanners peuvent être achetés en tant qu’appareils isolés, mais les imprimantes modernes sont souvent équipées d’un scanner. Pour ce faire, il faut un ordinateur et un support de stockage sur lequel le fichier peut être sauvegardé. Il peut s’agir soit du disque dur de l’ordinateur, soit d’une mémoire en nuage en ligne.

Étape 2: Trier les documents papier

Pour permettre un traitement efficace, les documents à numériser doivent être correctement triés. À cet égard, il convient de mettre l’accent sur l’étape suivante afin de faciliter la poursuite des travaux.

Étape 3: Numériser les documents

Au cours de cette étape, le scanner permet de scanner le document et de créer un fichier grille/image qui sera stocké localement sur l’ordinateur.

Étape 4: Transformation assistée par logiciel des fichiers

Une fois le fichier image généré, le fichier peut être converti. Pour ce faire, il est nécessaire de disposer d’un des nombreux outils OCR qui, en quelques clics du fichier grille, crée un fichier texte dans des formats connus tels que.docx ou.txt, et peut donc être modifié par des programmes d’écriture bien connus.

Possibilités pour les PME

Transformer les médias analogiques en numériques

Première étape vers l’automatisation des processus

Gestion simplifiée des documents

Prévention des erreurs de transcription

Contactez

Vous avez besoin d’aide à l’introduction dans votre entreprise?

Contactez-nous!

Utilisez notre radar technologique pour suivre les principales technologies pertinentes pour les PME!

Retour au radar technologique

Recognition des Character Optical Character Recognition (OCR)

The transformation from analog to digital!

OCR, or Optical Character Recognition, describes a technology that can create text files from raster/image files such as PDFs, JPGs, etc. can create text files. The conversion makes it possible to use the data obtained for further processing or to automate processes such as invoice processing.

Prototypes et démonstrateurs présents
Utilisation transsectorielle
Les PME sont-elles adaptées?

The current status

OCR is a basic technology for many programs that deal with the processing of documents. This technology makes it possible to digitize and prepare documents that are available in paper form. This eliminates the need for analog transmission by typing out documents pertinents. «Pieces of paper consisting exclusively of machine print can already be completely digitized with a very high degree of reliability». OCR is used, among other things, as the basis for document management systems to enable further processing and automation of paper documents, such as invoices or delivery bills.

How does OCR work?

OCR technology is characterized above all by pattern recognition. IT divides the image file into different categories. A distinction is made here between figures, tables and text blocks. Once the program has identified a text block, the next step is to analyze the individual letters. For the computer, these letters are merely groupings of pixels that it cannot yet work with. The program recognizes these groupings (OCR) and compares them with an existing database and converts them into characters. In order to improve the recognition of handwritten texts, the groupings are also compared at character level (ICR) and word level (IWR) from another database in the next step.

Reconnaissance intelligente du Character Recognition

Reconnaissance intelligente des crimes error correction at character level. This checks whether the recognized character makes sense in the context of the word. Examples of this would be the easily confused characters «O» and «0» (zero) or «B» et «8». The number 0 could be recognized in the word «Or» and replaced by ICR with the correct letter «O».

Recognition Word intelligente

Recognition Word Word (IWR) intelligente describes error correction at word level. Particularly with handwritten continuous text, it can happen that the individual characters cannot be recognized by the RCO technology. IWR compares global characteristics of the word with a word database in order to increase the correct recognition rate.

Introduction STEP-by-step

STEP 1: Infrastructure technique

OCR technology can create a digital text file from a piece of paper. However, a raster or image file must first be created from the document. This is done using a scanner. Scanners can be purchased as stand-alone devices, but modern printers are souvent already equipped with a scanner. This requires a computer and a storage medium on which the file can be saved. This can either be the computer’s hard disk or an online cloud storage.

STEP 2: SORT paper documents

To enable efficient processing, the documents to be digitized must be sorted sensibly. Here, emphasis should be placed on the subsequent work step in order to make further work easier.

STEP 3: Scan documents

In this step, the scanner is used to scan the document and create a raster/image file that is saved locally on the computer.

STEP 4: Conversion logicielle assistée des files

Once the image file has been created, the file can be converted. This requires one of many OCR tools that can create a text file from the raster file in familiar formats such as.docx or.txt with just a few clicks and can therefore be processed by familiar writing programs.

Opportunités pour les PME

Conversion à partir de médias analogiques au numérique

Premier pas vers le processus automation

Gestion des documents Simplified document management

Avoidance of transmission errors

Contact us

Do you need support with the introduction in your company?

Ensemble in touch with us!

Keep an eye on the most important SME-relevant technologies with our technology radar!

Back to the technology radar
European Digital Innovation Hub Sarre
  • adresse
    c/o ZeMA, Eschberger Weg 46, D-66121 Sarrebruck
  • téléphone
    +49 (0) 681 85787 – 300
  • Courriel
    info@edih-saarland.de

L'European Digital Innovation Hub Saarland (EDIH Saarland) accueillera jusqu'à 50% financé par des fonds de l’UE (GA 101083337) et par le ministère de l’économie, de l’innovation, du numérique et de l’énergie de la Sarre. L'EDIH Saarland offre aux PME de la région un guichet unique gratuit pour la numérisation et l'application de l'intelligence artificielle (IA). Au cours des trois prochaines années (2023-2025), une expertise déterminante sera mise à disposition pour le transfert pratique de l'IA industrielle en Sarre, dans la Grande Région (Sarre-Lor-Lux) et en Europe.

Le ZeMA en est le chef de file, aux côtés des partenaires du projet AWSi, DFKI, saaris et East Side Fab.

European Digital Innovation Hub Sarre
  • Mentions légales
  • Protection des données
  • Modifier les paramètres de confidentialité
  • Historique des paramètres de confidentialité
  • Retirer le consentement
Mentions légales & Paramètres des cookies

© European Digital Innovation Hub Saarland

Tous en peau
Consentement à l’utilisation de cookies avec bandeau de cookie réel