Doorgaan naar inhoud
YouTube-pagina opent in nieuw vensterFacebookpagina opent nieuw vensterLinkedIn-pagina opent in nieuw vensterInstagram-pagina opent in nieuw vensterRSS-pagina opent in nieuw venster
Europese digitale-innovatiehub Saarland
Europese digitale-innovatiehub SaarlandEuropese digitale-innovatiehub Saarland
  • Data/evenementen
  • Aanbiedingen
    • Trainingen
    • Financieringsprogramma’s
    • Beste praktijk
    • Webinar
    • Technologische radar
  • Nieuwsberichten
  • Over ons
  • nl_BENederlands (België)
    • en_GBEnglish (UK)
    • de_DEDeutsch
    • fr_FRFrançais
  • Data/evenementen
  • Aanbiedingen
    • Trainingen
    • Financieringsprogramma’s
    • Beste praktijk
    • Webinar
    • Technologische radar
  • Nieuwsberichten
  • Over ons
  • nl_BENederlands (België)
    • en_GBEnglish (UK)
    • de_DEDeutsch
    • fr_FRFrançais

Optische tekenherkenning (OCR)

De transformatie van analoog naar digitaal!

OCR of Optical Character Recognition beschrijft een technologie die kan worden aangemaakt uit raster-/beeldbestanden zoals PDF’s, JPG’s enz. De verwerking maakt het mogelijk de verkregen gegevens te gebruiken voor de verdere verwerking of automatisering van processen, zoals factuurverwerking.

Prototypes en demonstratiemodellen beschikbaar
Sectoroverschrijdende uitrol
Geschikt voor kmo’s?

Stand van zaken

OCR is een basistechnologie voor veel programma’s die betrekking hebben op de verwerking van documenten. Deze technologie maakt het mogelijk papieren documenten te digitaliseren en te verwerken. Als gevolg daarvan wordt analoge transmissie niet uitgevoerd door relevante documenten te onderdompelen. Papieren documenten die uitsluitend machineleesbaar zijn, kunnen al met een zeer hoge mate van betrouwbaarheid volledig worden gedigitaliseerd. De VOC wordt onder meer gebruikt als basis voor documentbeheersystemen om de verdere verwerking en automatisering van papieren documenten, zoals facturen of leveringsbonnen, mogelijk te maken.

Hoe werkt de VOC?

OCR-technologie wordt voornamelijk gekenmerkt door patroonherkenning. Zo deelt zij het beeldbestand in verschillende categorieën in. Figuren, tabellen en tekstblokken worden hier onderscheiden. Zodra het programma een tekstblok heeft gevonden, zal de volgende stap erin bestaan de afzonderlijke brieven te analyseren. Voor de computer zijn deze letters simpelweg groepen pixels waarmee het nog niet kan werken. Het programma identificeert deze groepen (OCR’s) en vergelijkt ze met een bestaande databank en zet ze om in tekens. Om de detectie van handgeschreven teksten te verbeteren, worden de groepen in de volgende stap ook getoetst op tekenniveau (ICR) en woordniveau (IMR) uit een andere databank.

“Smart Character Recognition”

Intelligent Character Recognition (ICR) beschrijft de correctie van de fout op tekenniveau. Derhalve wordt nagegaan of het geïdentificeerde teken in de context van het woord zinvol is. Voorbeelden zijn de gemakkelijk te verwarren tekens “O” en “0” (nul) of “B” en “8”. Figuur 0 kan worden gedetecteerd in het woord “Oder” en vervangen door ICR met de juiste letter “O”.

Intelligente wereldherkenning

Intelligente Word Recognition (IWR) beschrijft de correctie van fouten op woordniveau. Met name in het geval van met de hand geschreven bloemen zijn individuele tekens mogelijk niet herkenbaar met OCR-technologie. Zo vergelijkt IWR de algemene kenmerken van het woord met een woorddatabank om het correcte detectiepercentage te verhogen.

Geleidelijke invoering

Salarisstap 1: Technische infrastructuur

OCR-technologie kan een digitaal tekstbestand uit een papieren stuk aanmaken. Van tevoren moet echter een raster/beeldbestand uit het document worden aangemaakt. Dit gebeurt door middel van een scanner. Scanners kunnen worden gekocht als op zichzelf staande apparaten, maar moderne printers zijn vaak al uitgerust met een scanner. Dit vereist een computer en een opslagmedium waarop het bestand kan worden opgeslagen. Dit kan de harde schijf van de computer zijn of een online cloud-geheugen.

Salarisstap 2: Papieren documenten sorteren

Om een efficiënte verwerking mogelijk te maken, moeten de te digitaliseren documenten op zinvolle wijze worden gesorteerd. Er moet aandacht worden besteed aan de volgende stap om de verdere werkzaamheden te vergemakkelijken.

Salarisstap 3: Scan documenten

In deze stap wordt de scanner gebruikt om het document te scannen en een raster/beeldbestand aan te maken dat lokaal op de calculator wordt opgeslagen.

Vierde stap: Softwareondersteunde bestandsconversie

Als het beeldbestand wordt gegenereerd, kan het bestand worden omgezet. Hiervoor is een van de vele OCR-tools nodig, die kunnen worden bewerkt door bekende schrijfprogramma’s met behulp van enkele klikken uit het rasterbestand om een tekstbestand in bekende formaten zoals.docx of.txt. aan te maken.

Kansen voor het MKB

Omzetting van analoge media naar digitaal

Eerste stap in de richting van automatisering van processen

Vereenvoudigd documentenbeheer

Vermijden van transcriptiefouten

Contact

Heeft u ondersteuning nodig bij het opzetten van uw bedrijf?

Neem contact met ons op!

Gebruik onze technologieradar om de belangrijkste technologieën die van belang zijn voor kleine en middelgrote ondernemingen te blijven bekijken!

Terug naar technologische radar

Optische tekenherkenning (OCR)

De transformatie van analoog naar digitaal!

OCR, of Optical Character Recognition, beschrijft een technologie die tekstbestanden uit raster-/beeldbestanden zoals PDF’s, GPG’s enz. kan aanmaken. De omzetting maakt het mogelijk de verkregen gegevens te gebruiken voor verdere verwerking of om processen zoals factuurverwerking te automatiseren.

Prototypes en demonstratiemodellen beschikbaar
Sectoroverschrijdende uitrol
Geschikt voor kmo’s?

De huidige status

OCR is een basistechnologie voor veel programma’s die betrekking hebben op de verwerking van documenten. Deze technologie maakt het mogelijk documenten die op papier beschikbaar zijn, te digitaliseren en voor te bereiden. Hierdoor is een analoge transmissie overbodig door relevante documenten te typeren. Papieren stukken die uitsluitend uit machinaal printen bestaan, kunnen reeds met een zeer hoge mate van betrouwbaarheid volledig worden gedigitaliseerd. De VOC wordt onder meer gebruikt als basis voor documentbeheersystemen om de verdere verwerking en automatisering van papieren documenten, zoals facturen of leveringsfacturen, mogelijk te maken.

Hoe werkt de VOC?

OCR-technologie wordt vooral gekenmerkt door patroonherkenning. Zij verdeelt het beeldbestand in verschillende categorieën. Hier wordt onderscheid gemaakt tussen cijfers, tabellen en tekstblokken. Zodra het programma een tekstblok heeft gevonden, is de volgende stap de analyse van de afzonderlijke letters. Voor de computer zijn deze letters slechts een combinatie van pixels waarmee het nog niet kan werken. Het programma erkent deze groepen (OCR) en vergelijkt ze met een bestaande databank en zet ze om in tekens. Om de herkenning van handgeschreven teksten te verbeteren, worden de groepen daarom in de volgende stap vergeleken op tekenniveau (ICR) en woordniveau (IWR) uit een andere databank.

“Smart Character Recognition”

Intelligent Character Recognition (ICR) beschreven foutcorrectie op tekenniveau. Daarbij wordt nagegaan of het erkende karakter in de context van het woord zinvol is. Voorbeelden hiervan zijn de gemakkelijk te verwarren tekens “O” en “0” (nul) of “B” en “8”. Het nummer 0 kan worden herkend in het woord “Or” en vervangen door ICR met de juiste letter “O”.

Intelligente wereldherkenning

Intelligente Word Recognition (IWR) beschreven foutcorrectie op woordniveau. Met name met handgeschreven doorlopende tekst kan het gebeuren dat de individuele tekens niet door de OCR-technologie kunnen worden herkend. IWR vergelijkt de algemene kenmerken van het woord met een woorddatabank om het correcte herkenningspercentage te verhogen.

Stapsgewijze inleiding

STEP1 Technische infrastructuur

OCR-technologie kan een digitaal tekstbestand aanmaken uit een stuk papier. Uit het document moet echter eerst een raster- of beeldbestand worden gemaakt. Dit gebeurt met behulp van een scanner. Scanners kunnen worden gekocht als op zichzelf staande apparaten, maar moderne printers zijn vaak al uitgerust met een scanner. Dit vereist een computer en een opslagmedium waarop het bestand kan worden opgeslagen. Dit kan de harde schijf van de computer zijn of een online cloudopslag.

Salarisstap 2: Papieren documenten sorteren

Om een efficiënte verwerking mogelijk te maken, moeten de te digitaliseren documenten goed worden gesorteerd. In dit verband moet de nadruk worden gelegd op de volgende stap van de werkzaamheden om de verdere werkzaamheden te vergemakkelijken.

Salarisstap 3: Scan documenten

In deze stap wordt de scanner gebruikt om het document te scannen en een raster/beeldbestand aan te maken dat lokaal op de computer wordt opgeslagen.

Salarisstap 4: Softwareondersteunde omzetting van de bestanden

Zodra het beeldbestand is aangemaakt, kan het bestand worden omgezet. Hiervoor is een van de vele OCR-instrumenten nodig die een tekstbestand uit het rasterbestand in vertrouwde formaten zoals.docx of.txt met slechts enkele klikken kunnen aanmaken en dus kunnen worden verwerkt door vertrouwde schrijfprogramma’s.

Kansen voor het MKB

Omzetting van analoge media naar digitaal

Eerste stap in de richting van procesautomatisering

Vereenvoudigd documentenbeheer

Vermijding van verzendfouten

Contact opnemen

Heeft u ondersteuning nodig bij de introductie in uw bedrijf?

Neem contact met ons op!

Houd met onze technologische radar de belangrijkste voor kmo’s relevante technologieën in de gaten!

Terug naar de technologische radar
Europese digitale-innovatiehub Saarland
  • Adres
    C/o ZEMA, Eschberger Weg 46, D-66121 Saarbrücken
  • Telefoons
    + 49 (0) 681 85787-300
  • Email adres
    info@edih-saarland.de

De Europese digitale-innovatiehub Saarland (EDIH Saarland) heeft tot 50% gefinancierd uit EU-fondsen (GA 101083337) en door het Ministerie van Economie, Innovatie, Digitaal en Energie van Saarland. De EDIH van Saarland biedt kmo’s in de regio een gratis éénloketsysteem voor de digitalisering en toepassing van artificiële intelligentie (AI). In de komende drie jaar (2023-2025) zal relevante expertise worden verstrekt voor de praktische overdracht van industriële AI in Saarland, de Grotere Regio (Saar-Lor-Lux) en Europa.

De ZEMA is hier het voortouw, samen met de projectpartners AWSi, DFKI, Saaris en East Side Fab.

Europese digitale-innovatiehub Saarland
  • Disclaimer
  • Privacy
  • Privacyinstellingen wijzigen
  • Geschiedenis van privacyinstellingen
  • Weigeren
Juridische richtsnoeren voor cookie-instellingen

© Europese digitale-innovatiehub Saarland

Ga naar top
Cookieconsent met Real Cookie Banner