Crawler

pilusch · 15. Aug 2016

Moin zusammen,

ich habe den crawler4j von github soweit Programmiert/implementier das er bei mir läuft und auch alle daten in einer txt Datei abspeichert.
Das Problem ist das mir einfach zuviel Information in der Ausgabe steht, ich brauche nur zwei Daten aus der html/txt und zwar wäre das nur <titel> .... </titel> und <body> .... </body> gibt es hierfür eine Anweisung (System.out.println(...));

Info: Die meisten Internet Seiten die ich mit dem crawler durchforste sind in html geschrieben.

Viele Grüße

Sogomn · 17. Aug 2016

Für den Titel gibt es die Methode "getTitle" in der Klasse HtmlParseData.

pilusch hat gesagt.:
Die meisten Internet Seiten die ich mit dem crawler durchforste sind in html geschrieben

Äh. Was denn sonst?

pilusch · 17. Aug 2016

danke für deine überaus hilfreich Antwort hab das Problem schon gelöst.

VfL_Freak · 17. Aug 2016

Moin,

pilusch hat gesagt.:
hab das Problem schon gelöst

dann ist es ja gut

Glaube nicht, dass irgendwer verstanden hat, was Du eigentlich wolltest ...

Gruß Klaus

pilusch · 17. Aug 2016

wenn du selber etwas nicht verstehst dann solltest du auch nicht drauf antworten...

Ps: das ganze wurde mit jsoup gelöst

Meniskusschaden · 17. Aug 2016

pilusch hat gesagt.:
wenn du selber etwas nicht verstehst dann solltest du auch nicht drauf antworten...

Manchmal liegt's auch daran, dass die Frage nicht gut gestellt ist. Ich glaube auch, dass es hier deshalb so wenig Antworten gab. Es zahlt sich oft aus, etwas Aufwand in eine sorgfältige Formulierung zu investieren.

VfL_Freak · 17. Aug 2016

Moin,

VfL_Freak hat gesagt.:
dann ist es ja gut

das war auch ironisch gemeint (ok, vermutlich verschwendete Ironie)

Aber du musst schon mir überlassen, worauf ich wie antworte!
Zugegebenermaßen war vlt. die Antwort von Meniskus... ein wenig kontruktiver

Gruß Klaus

	Titel	Forum	Antworten	Datum
B	Web Crawler Algorithmen mit Jsoup	Allgemeine Java-Themen	3	30. Dez 2022
J	Crawler selbst geschreiben: OutOfMemoryError	Allgemeine Java-Themen	14	15. Feb 2010
M	Queue für spider/crawler?	Allgemeine Java-Themen	2	26. Aug 2009
Q	Suche Crawler	Allgemeine Java-Themen	2	22. Jan 2007
R	Crawler mit Java schreiben	Allgemeine Java-Themen	5	17. Okt 2006

Crawler

pilusch

Mitglied

Sogomn

Bekanntes Mitglied

pilusch

Mitglied

VfL_Freak

Top Contributor

pilusch

Mitglied

Meniskusschaden

Top Contributor

VfL_Freak

Top Contributor

Ähnliche Java Themen

Aktuelle Jobs

Neue Themen