Tesseract-OCR 4.0 unter Linux funktioniert nicht

Bitte aktiviere JavaScript!
Hallo zusammen,

ich bräuchte mal eure Fachmännische Kenntnisse:

Meine Umgebung
- Tesseract-OCR 4.0 (siehe Screenshot "tesseract")
- Ubuntu Mate (siehe Screenshot "Linux").
- IntelliJ IDEA
- Es wird Tess4J Version: 4.3.1 verwendet als Wrapper Klasse für Tesseract

Mein Ziel
Ich möchte TIF-Dateien mithilfe von Tesseract-OCR auslesen. Das ganze soll später auf einem PI laufen. Der geschrieben Code funktioniert auch allerdings nur unter Windows. Dazu später mehr.

Mein Problem
Zuvor hatte ich eine ältere Ubuntu Version verwendet, um genau zu sein Ubuntu 16. Darauf lief nur Tesseract 3.0.4.
Jetzt wollte ich auf die neuste Version von Tesseract aktualisieren und war damit auch gezwungen mein Ubuntu zu updaten.
Seit dem funktioniert gar nichts mehr :(.

Ich habe zuerst Ubuntu mit der neuen Version einfach neuinstalliert. Dann hab ich Tesseract Installiert und anschließend meine Entwicklungsumgebung und dann mein Projekt wieder drauf gezogen. Jetzt wollt ich das Projekt Compilieren und ich hab eine Fehlermeldung erhalten (siehe Screenshot "Error-IDE"). Zu der Fehlermeldung ist auch ein Log angehongen. Diese Txt-Datei befindet sich ebenfalls im Anhang.

Testweise habe ich das ganze mal auf einem Windows Rechner laufen lassen und da funktioniert alles Problem los. 1:1 das gleiche Projekt.
Ich kann leider auch nicht eine ältere Version von Tesseract verwenden, da ich mit der neuen Version deutlich bessere Ergebnisse erziele.
Leider bin ich etwas überfragt, wie ich das Problem lösen kann.

Hat von euch vielleicht jemand eine Idee oder einen Lösungsansatz?
 

Anhänge

A

Anzeige




Vielleicht hilft dir unser Kurs hier weiter —> (hier klicken)
Danke für deine Antwort.
Leider hat mir das jetzt auf anhieb nicht direkt geholfen.

Ich bin auch für alternativ Lösungen bereit, also etwas anderes statt tess4j zu nutzen oder eine alternative für Tesseract-OCR zu verwenden.
Solang das Ergebnis das gleiche ist, sprich TIF-Datei in String umwandeln und das ganze in Java funktioniert, bin ich auch für andere Vorschläge offen.
 
Okay es hat geklappt ich danke dir @mihe7

Folgendes hab ich gemacht:

Terminal geöffnet > "export LC_ALL=C" eingegeben (ohne die "") > fertig

Tesseract hat anscheinend ein Problem die Locale Varaible zu setzen, wenn die gesetzt ist funktionierts.
Ob die Variable gesetzt wurde kann mit "locale" überprüft werden.

Thema kann geschlossen werden :)
 
Passende Stellenanzeigen aus deiner Region:

Oben