Hallo zusammen,
ich logge mich mittels Apaches HttpClient auf eine Seite ein und lese anschließend eine Seite dieser Website aus. Die gewonnen Daten schreibe ich in eine Datei. Klappt soweit ganz gut, allerdings hab ich das Problem dass die Daten gelegentlich unvollständig sind. Zum Beispiel fallen teile der Tags am Ende der Zeile raus
anstatt <b>Name</b> wird dann nur noch <b>Name ausgelesen.
Es ist nicht auf Tags beschränkt, es kommt auch vor das dann der Name nur noch teilweise vorhanden ist.
Es ist kein bestimmtes Muster in den Fehlern zu erkennen, Fehler treten immer an unterschiedlichsten Stellen auf. Daher gehe ich davon aus, dass es sich um einen Fehler beim Auslesen handelt.
Hier ist meine Auslesecode:
Ich hoff es gibt bereits Erfahrungen mit diesen Übertragungsfehlern und ihr könnt mir Tipps zum vollständigen Auslesen der Daten geben oder andere Fehlerquellen nennen.
Mit freundlichen Grüßen
Phillip
ich logge mich mittels Apaches HttpClient auf eine Seite ein und lese anschließend eine Seite dieser Website aus. Die gewonnen Daten schreibe ich in eine Datei. Klappt soweit ganz gut, allerdings hab ich das Problem dass die Daten gelegentlich unvollständig sind. Zum Beispiel fallen teile der Tags am Ende der Zeile raus
anstatt <b>Name</b> wird dann nur noch <b>Name ausgelesen.
Es ist nicht auf Tags beschränkt, es kommt auch vor das dann der Name nur noch teilweise vorhanden ist.
Es ist kein bestimmtes Muster in den Fehlern zu erkennen, Fehler treten immer an unterschiedlichsten Stellen auf. Daher gehe ich davon aus, dass es sich um einen Fehler beim Auslesen handelt.
Hier ist meine Auslesecode:
Code:
he = hr.getEntity();
if(he != null)
{
InputStreamReader inreader = new InputStreamReader(he.getContent(), "ISO8859_1");
char[] cbuf = new char[2048];
if(!new File(path).exists())
new File(path).createNewFile();
PrintWriter fw = new PrintWriter(new File(path));
System.out.println("und abspeichern...");
System.out.println("######################################");
while(inreader.read(cbuf) != -1)
{
fw.println(cbuf);
}
System.out.println("######################################");
System.out.println("Daten stehen nun zur Verarbeitung bereit");
return true;
}
Ich hoff es gibt bereits Erfahrungen mit diesen Übertragungsfehlern und ihr könnt mir Tipps zum vollständigen Auslesen der Daten geben oder andere Fehlerquellen nennen.
Mit freundlichen Grüßen
Phillip