Hallo,
Seit Apachte Tike Version 1.16 hagelt es von roten Warnmeldungen.
Was ich darüber finden konnte und gelesen habe, ist das Tika nun auch OCR Erkennung durchführen können soll und daher diese Bibliotheken benötigt.
Also geladen und in das Projekt eingebunden. Leider konnte ich kaum etwas dazu finden, wie man diese Meldungen weg bekommen kann. Viel englische Seiten, von denen ich kaum was verstanden habe.
Zurück zur Version 1.13 habe ich die Medlungen nicht mehr. Aber mit einer alten Bibliothek möchte ich nicht so gerne weiter Entwicklen, da es früher oder später doch zur aktuellen Bibliothek kommen wird.
Auch habe ich das Problem der Erkennung der Sprache
Der Code funktioniert zwar aber LanguageIdentifier ist durchgestrichen (depricated).
Auch in den Beispielcode von Tika 1.16 ist alter Code so wie diesen.
Kann mir vielleicht jemand sagen, wie das jetzt funktionieren soll?
Auch habe ich mal einen Codeschnipsel gefunden, der aber nicht funktioniert.
Ich würde mich freuen, wenn mir jemand helfen würde.
Vielen Dank
M
Seit Apachte Tike Version 1.16 hagelt es von roten Warnmeldungen.
Code:
Sep 28, 2017 5:02:38 PM org.apache.tika.config.InitializableProblemHandler$3 handleInitializableProblem
WARNUNG: JBIG2ImageReader not loaded. jbig2 files will be ignored
See https://pdfbox.apache.org/2.0/dependencies.html#jai-image-io
for optional dependencies.
TIFFImageWriter not loaded. tiff files will not be processed
See https://pdfbox.apache.org/2.0/dependencies.html#jai-image-io
for optional dependencies.
J2KImageReader not loaded. JPEG2000 files will not be processed.
See https://pdfbox.apache.org/2.0/dependencies.html#jai-image-io
for optional dependencies.
Sep 28, 2017 5:02:38 PM org.apache.tika.config.InitializableProblemHandler$3 handleInitializableProblem
WARNUNG: org.xerial's sqlite-jdbc is not loaded.
Please provide the jar on your classpath to parse sqlite files.
See tika-parsers/pom.xml for the correct version.
Also geladen und in das Projekt eingebunden. Leider konnte ich kaum etwas dazu finden, wie man diese Meldungen weg bekommen kann. Viel englische Seiten, von denen ich kaum was verstanden habe.
Zurück zur Version 1.13 habe ich die Medlungen nicht mehr. Aber mit einer alten Bibliothek möchte ich nicht so gerne weiter Entwicklen, da es früher oder später doch zur aktuellen Bibliothek kommen wird.
Auch habe ich das Problem der Erkennung der Sprache
Java:
LanguageIdentifier identifier = new LanguageIdentifier("Text Mit Leerzeichen");
String language = identifier.getLanguage();
System.out.println("Language of the given content is : " + language);
Auch in den Beispielcode von Tika 1.16 ist alter Code so wie diesen.
Kann mir vielleicht jemand sagen, wie das jetzt funktionieren soll?
Auch habe ich mal einen Codeschnipsel gefunden, der aber nicht funktioniert.
Ich würde mich freuen, wenn mir jemand helfen würde.
Vielen Dank
M