Optische tekenherkenning (OCR)

Optische tekenherkenning (OCR)

Optische tekenherkenning (OCR)

Optische tekenherkenning is een methode voor automatische tekenherkenning en is bedoeld om tekens (letters, cijfers) uit beeldbestanden te herkennen en vervolgens numerieke waarden aan deze tekens toe te kennen (ASCII, Unicode), die de computer vervolgens kan uitlezen als elektronische, doorzoekbare volledige tekst. Moderne algoritmen kunnen zowel gedrukte letters als handgeschreven teksten herkennen. Tegenwoordig wordt ook gebruik gemaakt van intelligente tekenherkenning (ICR) om de herkende tekens te corrigeren op basis van de context. Een herkende "1" kan dus worden gecorrigeerd in een "I" als hij binnen een woord wordt gebruikt. Herkend: "Ha1lo" -> Gecorrigeerd: "Hallo".

OCR-mogelijkheden OCR-mogelijkheden
© Eigene Darstellung (Credits: Lukas Rengbers)

Toepassingsvoorbeelden

Voorlezenvan doktersrecepten
Voorlezen van handgeschreven doktersrecepten

Post sorteren
Handgeschreven brieven worden vastgelegd met cameratechnologie. De tekens worden herkend door OCR en de letters worden dienovereenkomstig gesorteerd.

Adobe Acrobat OCR
Gescande documenten kunnen gemakkelijk en snel worden omgezet in PDF-bestanden met bewerkbare tekst.

Geautomatiseerde digitalisering van historische drukken
Intussen kunnen zelfs historische drukken met een inconsistente orthografie, veelvuldig voorkomende eigennamen en wisselende lettertypes op bevredigende wijze worden herkend.

Regionale bedrijven

Kaitos GmbH
Münster
Voorbeeldtoepassing: grootschalige digitalisering van doktersrecepten
https://www.kaitos.ai