Hallo Leute!
Ich bin gerade dabei, eine doc-Datei (Open Office bzw. Ms Word) einzulesen, um diese anschließend analysieren zu können. Doch leider liest er ja die doc-Datei nur binär ein, was mir grad nichts bringt. Ich brauche also eine Methode, die mir eine Word-Datei zeilenweise einliest und erstmal in ein String-Array speichert, damit ich das dann weiterbearbeiten kann.
Das ganze geht ja bei einer Textdatei, doch wie mache ich das bei doc-Dateien von OpenOffice bzw. Word?
Kann mir da jemand weiterhelfen?
Danke im Voraus für Eure Antworten!
Tschau!
Ich bin gerade dabei, eine doc-Datei (Open Office bzw. Ms Word) einzulesen, um diese anschließend analysieren zu können. Doch leider liest er ja die doc-Datei nur binär ein, was mir grad nichts bringt. Ich brauche also eine Methode, die mir eine Word-Datei zeilenweise einliest und erstmal in ein String-Array speichert, damit ich das dann weiterbearbeiten kann.
Code:
public static void main(String[] args)
{
String s;
BufferedReader br = null;
List<String> al_daten = new ArrayList<String>();
int i=0;
try
{
br = new BufferedReader(new FileReader("c:\\Temp\\Testdatei.txt"));
try
{
while ((s = br.readLine()) != null)
{
al_daten.add(s);
i++;
}
for(String s1:al_daten)
{
System.out.println(s1);
}
}
finally
{
if (br != null)
br.close();
}
}
catch (IOException io)
{
System.out.println(io.getMessage());
}
}
Kann mir da jemand weiterhelfen?
Danke im Voraus für Eure Antworten!
Tschau!