Hallo,
kennt jemand eine OCR Library für Belegerkennung?
Also sprich ich lese ein Bild / PDF ein und ich bekomme bspw. ein JSON heraus, mit den Infos:
- Firmenname
- Nettobetrag
- Bruttobetrag
- Rechnungsnummer
-....
Mit "Tesseract OCR" bekommt man sicherlich den Text heraus. Aber anschließend benötige ich eine Logik um die Infos zum Beleg zu bekommen.
Ich habe hier auch etwas gelesen, dass hierbei eine KI verwendet wird...
Bpsw. finde ich im String (den ich von Tesseract OCR bekomme) den Name "Rechnungsnummer". Woher weiß ich dann aber, dass nebendran die Rechnungsnummer ist etc.?
Wenn ich weiß, wie das funktioniert, wäre es auch eine Überlegung wert dies zu programmieren.
Oder kennt jemand eine API - Anbindung, die man nutzen könnte und für den Anfang zunächst kostenlos ist?
Vielen Dank für Tipps
kennt jemand eine OCR Library für Belegerkennung?
Also sprich ich lese ein Bild / PDF ein und ich bekomme bspw. ein JSON heraus, mit den Infos:
- Firmenname
- Nettobetrag
- Bruttobetrag
- Rechnungsnummer
-....
Mit "Tesseract OCR" bekommt man sicherlich den Text heraus. Aber anschließend benötige ich eine Logik um die Infos zum Beleg zu bekommen.
Ich habe hier auch etwas gelesen, dass hierbei eine KI verwendet wird...
Bpsw. finde ich im String (den ich von Tesseract OCR bekomme) den Name "Rechnungsnummer". Woher weiß ich dann aber, dass nebendran die Rechnungsnummer ist etc.?
Wenn ich weiß, wie das funktioniert, wäre es auch eine Überlegung wert dies zu programmieren.
Oder kennt jemand eine API - Anbindung, die man nutzen könnte und für den Anfang zunächst kostenlos ist?
Vielen Dank für Tipps