Crawler

pilusch

Mitglied
Moin zusammen,

ich habe den crawler4j von github soweit Programmiert/implementier das er bei mir läuft und auch alle daten in einer txt Datei abspeichert.
Das Problem ist das mir einfach zuviel Information in der Ausgabe steht, ich brauche nur zwei Daten aus der html/txt und zwar wäre das nur <titel> .... </titel> und <body> .... </body> gibt es hierfür eine Anweisung (System.out.println(...));

Info: Die meisten Internet Seiten die ich mit dem crawler durchforste sind in html geschrieben.

Viele Grüße
 

Ähnliche Java Themen

Neue Themen


Oben