OCR ist die Abkürzung für Optical Character Recognition und bezeichnet jene Technologie, die es ermöglicht, in Bildern, gescannten Dokumenten oder PDF-Dateien Zeichen zu erkennen, um die jeweiligen Formate bearbeitbar zu machen.
Dokumente, die nicht nur zur Archivierung, sondern auch zur Weiterbearbeitung gebraucht werden, können grundsätzlich nicht verarbeitet werden, wenn sie in einem Bildformat vorliegen, da Inhalte oder Buchstaben von einer herkömmlichen Standard-Software nicht als solche erkannt werden. Die Notwendigkeit, diese Bilder händisch abzutippen, bindet im Office nicht nur viele Ressourcen, es ist auch ausgesprochen mühsam.
Die OCR schafft Abhilfe, indem Bilddateien (unerheblich ob Foto oder PDF) nutzbar gemacht werden. Hinter dieser Technologie steckt ein Mustervergleich. Zunächst werden Seiten und Gliederung von der Optical Character Recognition identifiziert, worauf die Trennung in relevante und irrelevante Teile erfolgt. Falls nötig, werden erste Korrekturen durchgeführt, sobald die Mustererkennung startet. Diesem Ablauf folgt ein Abgleich mit einer Datenbank; der Vergleich von erkannten und gespeicherten Mustern führt zum sogenannten Rohdigitalisat. Dieses wird mit einem Wörterbuch verglichen. Sogar handschriftliche Texte können mit OCR identifiziert und weiterverarbeitet werden. Ebenso ist mittlerweile die Nutzung via Smartphone, egal ob iPhone oder Android, möglich.
Anzumerken ist, dass händische Korrekturen zumeist unumgänglich sind und die Vorlage von möglichst guter Qualität sein sollte, um den Nachbearbeitungsbedarf zu minimieren.
Bei der Auswahl des passenden OCR-Produkts wird man zahlreiche kostenpflichtige Angebote finden, die mitunter wesentlich mehr Funktionen bieten als tatsächlich benötigt werden.
OCR eignet sich hervorragend für den Einsatz von Machine Learning und künstlicher Intelligenz.
Hinterlasse einen Kommentar
An der Diskussion beteiligen?Hinterlasse uns deinen Kommentar!