Angesichts der Dokumentenflut auf dem Schreibtisch träumen Mitarbeiter in der Kommunalverwaltung vom papierlosen Büro. OCR-Technologien zur optischen Zeichenerkennung und Digitalisierung von Papierdokumenten erleichtern die Behördenarbeit.
Laut einer Studie des IT-Branchenverbands Bitkom aus dem Oktober 2015 kommt das e-Government nur mühsam voran. Lediglich die Hälfte der Bundesbürger nutzt das Internet, um mit Behörden zu kommunizieren. Das Resultat sind weiterhin hohe Papierberge in der öffentlichen Verwaltung. Die damit einhergehenden Herausforderungen wie erhöhter Platzbedarf und unflexibler Zugriff auf Papierdokumente können durch Scannen schnell beseitigt werden. Und noch mehr: Mit dem richtigen Vorgehen bei der Digitalisierung können die enthaltenen Daten sogar maschinell und damit schneller verarbeitet werden.
Mittlerweile gibt es viele Möglichkeiten Dokumente zu digitalisieren. Wurden Dokumente früher meist über Scanner, Multifunktionskopierer oder -drucker im Büro gescannt, ist heute ein Smartphone ausreichend. Denn mit der Digitalkamera, die heute in jedem Tablet oder Smartphone vorhanden ist, kann jedes Dokument rasch abfotografiert werden. So gesehen, trägt praktisch jeder Bürger einen mobilen Scanner in seiner Hosentasche. Behörden und Verwaltungsorganisationen werden also in der Zukunft nicht mehr nur vor der Herausforderung stehen, eingehende Dokumente intern zu digitalisieren. Auch die Bürger selbst werden immer öfter Dokumente mit relevanten Informationen einfach abfotografieren und per e-Mail an die Verwaltungen senden. Moderne Verwaltungen werden sich auf die digitalen Eingangskanäle einstellen müssen.
OCR-Software macht Text editierbar
Die Digitalisierung von Dokumenten allein bietet indes meist nur einen geringen Mehrwert, da es sich bei einem Scan um ein Bild handelt. Der volle Nutzen kann erst dann erzielt werden, wenn die Mitarbeiter und IT-Systeme auf die Informationen in einem Dokument zugreifen können. Dies wird möglich durch den Einsatz von optischen Texterkennungs-Technologien (OCR, engl.: optical charakter recognition). OCR-Programme erfassen die Gestalt der dargestellten Buchstaben und wandeln sie in „richtigen“, bearbeitbaren Text um. So entstehen aus den Scans der Dokumente neue, editierbare Formate. Diese lassen sich am Computer verarbeiten und nach Schlagwörtern durchsuchen.
Moderne Software zur optischen Zeichenerkennung kann von Sachbearbeitern flexibel verwendet werden, um eingehende Papierunterlagen zu digitalisieren. Dieser direkte Verarbeitungsansatz kann eine adäquate Lösung für kleinere Kommunen sein. Ab einer bestimmten Mitarbeiterzahl beziehungsweise einem entsprechendem Dokumentenvolumen ist es allerdings sinnvoll, die Bearbeitungsprozesse zu automatisieren. IT-Hersteller bieten hierfür serverbasierte Lösungen an, die zentral verwaltet werden können und so eine vollautomatische Dokumentendigitalisierung und Konvertierung bieten.
Mit OCR-Technologie digitalisierte Dokumente können über eine Stichwortsuche aufgefunden werden. Aber wer garantiert, dass in zehn oder mehr Jahren noch Programme existieren, mit denen diese Dateien geöffnet werden können? Als Standard für durchsuchbare Dokumente hat sich das Format PDF (eng.: portable document format) durchgesetzt. Um Dokumente auch langfristig sicher archivieren zu können, wurde von der International Organization for Standardization (ISO) das PDF/A-Format – ein Format zur Langzeitarchivierung – definiert. Es umfasst genau festgelegte Vorschriften über den Aufbau eines PDFs.
Langfristig wird sich auch im Verwaltungsumfeld der Trend zur Digitalisierung von Papier und anschließender Archivierung durchsetzen. In vielen Unternehmen hat die Automatisierung von dokumentenbasierten Geschäftsprozessen längst begonnen. Eingehende Dokumente werden nicht nur automatisch digitalisiert, klassifiziert und archiviert, es werden mittels semantischer Analysen bereits sinntragende Informationen aus den Dokumenten ausgelesen und an nachgelagerte Systeme übergeben. Moderne IT-Lösungen können außerdem erkennen, um welches Dokument es sich handelt und es an den zuständigen Sachbearbeiter weiterleiten.
Michael Fuchs
Der Autor
Michael Fuchs ist Technology Evangelist beim Softwarehersteller Abbyy Europe mit Sitz in München