Verfahren zum Scannen von Rechnungen: OCR-Tool

21. Juni 2014 | Rechnungs-Workflow

Im Bereich der Kreditorenbuchhaltung ist bekannt, dass das Ende einer Kreditorenrechnung bei ihrer Buchung und alle Verbesserungselemente, die wir in den Kreditorenrechnungsprozess einführen, darauf abzielen müssen, den Buchungszyklus zu verkürzen und die Kosten des Prozesses so weit wie möglich zu reduzieren. Daher ist das Scannen von Rechnungen ein unmittelbar bevorstehender Schritt nach vorn.

Verfahren zum Scannen von Rechnungen

Innerhalb eines Digitalisierungsprozesses für Lieferantenrechnungen können wir 4 Hauptphasen definieren:

  • 1. die Rechnungsbildung und 2- oder 3-Wege-Quadranten gegen die Bestellung.
  • 2. Rechnungsgenehmigung für die Annahme von Rechnungen auf der Grundlage von Geschäftskriterien.
  • 3. Lösung von Vorfällen, Kategorisierung von Ausnahmen für die verfahrenstechnische Lösung.
  • 4. Automatische Rechnungsbuchung.

Alle diese Phasen der Digitalisierung der Rechnungen werden mit Workflow-Tools automatisiert, wie wir bereits in unserem vorherigen Beitrag angedeutet haben, aber es gibt eine Grundvoraussetzung für ihren Betrieb: die in den Rechnungen enthaltenen Daten müssen verfügbar sein. Dieser Punkt stellt für elektronische Rechnungen kein Problem dar, da alle grundlegenden Rechnungsinformationen strukturiert in der Datei enthalten sind, aber was ist mit Papierrechnungen und Rechnungen, die per E-Mail im PDF-Format eingehen?

Prozess des Rechnungsscannens: Werkzeuge und Funktionalität

Die Verarbeitung von Papierrechnungen, die zuvor gescannt wurden, und PDF-Rechnungen erfordert ein OCR (Optical Character Recognition)-Tool zur Datenextraktion.

Was ist OCR?

OCR ermöglicht es uns, Daten aus Rechnungen zu extrahieren und für die weitere Verarbeitung zu verwenden.

Bei easyap setzen wir verschiedene OCR-Plattformen der ersten Ebene für die Verarbeitung von Papier- und PDF-Rechnungen im Rahmen des Outsourcings von Kreditorenprozessen ein. Durch den Einsatz dieser Plattformen seit mehr als 12 Jahren verfügen wir über eine sehr wichtige Erfahrung, wenn es darum geht, das tatsächliche Potenzial, die Grenzen und Abhängigkeiten dieser Rechnungen zu kennen.

Funktionalität der OCR-Plattform

OCR-Plattformen sind eine große Hilfe, aber sie sind weit davon entfernt, Standalone-Lösungen und "out of the box"-Tools zu sein, die unbeaufsichtigt ohne Entwicklung und wiederkehrende Wartung arbeiten können. Im Allgemeinen sollte ein OCR-Tool die folgenden Schritte abdecken

  • (1) Die Klassifizierung von Dokumenten im Abschnitt über Rechnungen muss zumindest die Identifizierung und Trennung von Rechnungen und ihren Anhängen erlauben.
  • 2. OCR, für die Erkennung von Rechnungsdaten. Je nach verwendeter Technologie kann diese Phase mehr oder weniger vorherige Parametrisierungsarbeit erfordern.
  • 3. manuelle Rechnungsvalidierung, zur Korrektur von Daten, die durch die OCR fehlerhaft extrahiert wurden. Es ist zu beachten, dass diese Phase nicht optional ist, da die automatische Verarbeitung von Rechnungen nach der OCR ohne manuelle Validierung aufgrund der Fehlerquote nicht möglich ist.
  • 4. Qualitätskontrolle, für die Lösung der Vorfälle der vorhergehenden Phasen wie: mehr als ein Dokument pro Rechnung, Bilder von schlechter Qualität, rotierende Bilder,...

Was die OCR-Plattformen betrifft, so gibt es zwei Hauptkategorien: template-basierte OCR und schlüsselwortbasierte OCR. So wie erstere eine spezifische Vorlage pro Lieferant erfordern, die für jeden Lieferanten angibt, wo jedes Rechnungsfeld zu finden ist, erfordern letztere die Definition von Suchbereichen und Schlüsselwörtern, um jedes Feld generisch für alle Lieferantenrechnungen zu finden. Einige der letzteren können ein Lernmodul enthalten, das die Selbsterstellung von Vorlagen auf der Grundlage manuell validierter Daten ermöglicht.

Darüber hinaus zeichnen sie sich dadurch aus, dass sie die Möglichkeit bieten, Detaillinien zu erfassen oder nicht.

Die Stärke der vorlagenbasierten OCR ist der höhere Grad der Anerkennung für jeden Anbieter, aber der Hauptpunkt gegen die Notwendigkeit, für jeden Anbieter eine Vorlage zu definieren. Die Definition von Vorlagen erfordert Hingabe und Abhängigkeit von technischen Ressourcen. Als Anhaltspunkt: Die Erstellung einer Lieferantenvorlage dauert durchschnittlich 12 Minuten für Rechnungen ohne Zeilen und 19 Minuten für Rechnungen mit Detailzeilen, und im Durchschnitt ändert ein Lieferant alle 17 Monate irgendeinen Parameter, der das Rechnungsformat beeinflusst, was die Neugestaltung der Vorlage erzwingt.

Schlüsselwortbasierte OCRs haben eine geringere Erfolgsrate, und "False Positives" werden beim Auffinden von Rechnungsfeldern erzeugt, erfordern aber weniger wiederkehrende Parametrisierung. Die bisherige Konfiguration ist zwar geringfügig, erfordert jedoch technische Ressourcen mit einem hohen Maß an Erfahrung.

OCR-Platadormas: Datenstandort

Im Hinblick auf den Speicherort der Rechnungsdaten und den Grad der Genauigkeit können wir 4 Hauptgruppen unterscheiden

  • - Numerische Daten: Das Lesen von numerischen Daten ist ziemlich genau, insbesondere von solchen, die arithmetisch validiert werden können, und vor allem in Rechnungen, die Steuern enthalten. Rechnungen mit mehreren Basen und Rechnungen aus Ländern, in denen es keine Mehrwertsteuer oder 0% Steuer gibt, weisen bei der automatischen OCR-Erfassung einen höheren Grad an Komplexität auf und weisen daher eine höhere Fehlerquote auf.
  • - Daten, die mit externen Quellen validiert werden können: z.B. Lieferanten- und Kunden-IDs. Die Validierung der erkannten Daten gegen externe Datenbanken erlaubt es, den Grad des Erfolgs im automatischen Modus zu erhöhen.
  • - Daten mit vordefiniertem Format: z.B. Bestellnummern oder Datumsangaben. Es kommt sehr häufig vor, dass Bestellnummern einem Muster in Bezug auf Länge und Zahlenbereich folgen, und die Suche nach Daten über den Standort bestimmter Formate vereinfacht das Verfahren und verbessert den Genauigkeitsgrad.
  • - Unstrukturierte Felder oder Felder ohne vordefiniertes Format: wie z.B. Rechnungsnummer, Lieferantenlieferscheinnummer, Büro, Abteilung, etc... Da sie kein universelles Suchmuster haben, haben diese Felder die höchste Fehlerquote bei der automatischen Erkennung.
  • - Detailzeilen: Gewöhnlich ist bei Rechnungen mit Bestellung die Extraktion der Rechnungszeilen für den Quadranten gegen die Bestellungen und/oder Belege erforderlich. Dies ist das komplexeste Element bei seiner Erkennung und dasjenige, das mehr manuelle Validierung zur Fehlerkorrektur erfordert. Die Komplexität ist so groß, dass nicht jede OCR-Software die Zeilenextraktion unterstützt.

Scannen von Rechnungen: OCR

Der Prozess des Scannens von Rechnungen mit einem OCR-Tool erfordert technische/IT-Ressourcen für die Konfiguration, Pflege und Anpassung von Vorlagen und Anwendungen sowie administrative Profilressourcen für Scan-, Validierungs- und Qualitätskontrollaufgaben.

Zusammenfassend könnten wir feststellen, dass OCR allein kein nützliches Werkzeug ist, da es die Automatisierung der nachfolgenden Schritte erfordert. Hinzu kommt, dass in einer Zeit, in der die Verwendung elektronischer Rechnungen erheblich zunimmt und die Verwendung von PDF-Rechnungen immer weiter verbreitet ist, die Investition in Rechnungsscan- und OCR-Prozesse nur bei einem erheblichen Rechnungsvolumen gerechtfertigt ist.

Ein Volumen von Papierrechnungen von weniger als 250.000 pro Jahr rechtfertigt weder die Investition in Technologie (Software und Hardware) noch die für die Wartung und den Betrieb der Lösung erforderlichen technischen und betrieblichen Ressourcen.

Bei Papierrechnungen garantiert ein Modell, das auf der Auslagerung des gesamten Prozesses, einschließlich des Arbeitsablaufs, basiert, eine kurze Implementierungszeit und bietet Einsparungen von über 30 % im Gesamtprozess.

Steigern Sie die Produktivität Ihres Unternehmens und optimieren Sie Ihre Abrechnungsprozesse

Haben Sie noch Zweifel? Kontaktieren Sie uns unter

12 + 7 =