Bild-zu-Excel OCR: Datenextraktion mit Copilot und Teamsware Studio automatisieren

🤖 Automatisierte Rechnungsdaten-Extraktion mit Microsoft 365 Copilot und Teamsware Studio

PDF-Rechnungen per KI analysieren und strukturiert weiterverarbeiten


Einleitung

Bei einer hohen Anzahl an Rechnungen ist manuelles Abtippen keine Option. Microsoft 365 Copilot ermöglicht es, auch komplexe PDF-Dateien mit mehreren Einzelrechnungen zu analysieren und relevante Inhalte in ein maschinenlesbares JSON-Format zu überführen.


📄 Schritt 1: PDF mit Copilot analysieren

Copilot erkennt nicht nur Text, sondern auch die logischen Zusammenhänge zwischen Rechnungsnummern, Datumsangaben, Beträgen und Steuersätzen.

  1. PDF-Datei in OneDrive oder SharePoint hochladen
  2. Copilot-Chat öffnen und Bezug auf die Datei nehmen

Copilot analysiert das Dokument kontextbezogen und bereitet die Inhalte strukturiert auf.


⚙️ Schritt 2: Rechnungsdaten als JSON extrahieren

Für automatisierte Prozesse ist die Ausgabe im JSON-Format ideal. JSON ermöglicht eine eindeutige, systemlesbare Datenstruktur.

Beispiel-Prompt:

Analysiere alle Rechnungen in diesem PDF.
Gib die Daten ausschließlich im JSON-Format aus.
Felder: Rechnungsnummer, Ausstellungsdatum,
Bruttobetrag, Währung, Absender.

Copilot gibt die extrahierten Rechnungen als JSON-Codeblock zurück, der direkt weiterverarbeitet werden kann.


⚙️✅ Schritt 3: Vollautomatisierung mit Teamsware Studio

Für den Unternehmenseinsatz empfiehlt sich eine vollständige Automatisierung mit Teamsware Studio.

  • Überwachung: Automatische Erkennung neuer PDF-Rechnungen
  • Extraktion: KI-gestütztes Auslesen und Strukturieren als JSON
  • Verarbeitung: Übergabe an SharePoint, ERP oder Buchhaltung
  • Validierung ✅: Prüfung gegen Stammdaten und Freigabe

💡 Warum JSON?

JSON bietet eine klare Feldzuordnung und vermeidet typische Fehler bei Datums- oder Währungsformaten.

  • ✅ Eindeutig maschinenlesbar
  • ✅ Direkte Systemintegration möglich
  • ✅ Robust gegenüber Formatunterschieden

In Kombination mit Microsoft 365 Copilot und Teamsware Studio werden unstrukturierte PDFs zu einem durchgängigen digitalen Datenstrom.