Attribute aus HTML Tags auslesen

Cyborg

Aktives Mitglied
Guten Abend,

ich versuche mich gerade daran aus einer externen Page alle Inhalte des "src"-Attributs von "img"-Tags auszulesen.

Beim googlen bin ich über den jsoup parser gestolpert.
Dieser liefert mir mit folgender Codezeile:

Java:
Jsoup.parse(new URL("http://www.ebay.de, 100000).select("img").attr("src");

aber leider nur die erste Image-URL.

In der Dokumentation finde ich leider keine passende Methode, die mir ALLE "src"-Attribute zurückliefert.

Hatte mal jemand ein ähnliches Problem und kann mir einen Tipp geben ?
 
I

irgendjemand

Gast
mal davon abgesehen das deine zeile da nicht ganz stimmt *vllt nur flüchtigkeitsfehler* steht in der doc das Elemtens.attr(String) nur das erste treffende element returned
Get an attribute value from the first matched element that has the attribute
da Elements aber eine List<?> ist kannst du über diese iterieren in dem du dir mit Elements.iterator() ein Iterator<Element> objekt holst ...
dort hast du dan erstmal alle <img> - tags des gesamten dokumentes ...

diese gehst du mit einer normalen while() durch

org.jsoup.nodes.Element erbt von org.jsoup.nodes.Node die methode attr(String) welche dir dann den wert des attributes returned ...

mit ein bisschen hintergrundwissen der standard-api und dem genauen lesen der entsprechenden lib-doc bekommt man sowas raus
 
I

irgendjemand

Gast
so .. hab mir mal die mühe für dich gemacht mit hilfe der doc was zusammen zu bauen ...
ich hab dabei mal alle klassen explizit angegeben um konflikte mit SE-klasse zu vermeiden
Java:
URL url="URL"; //URL der seite
int timeout=1000; //timeout
String tag="TAG"; //gewünschtes TAG
String attribute="ATRIBUTE"; //gewünschtes ATTRIBUT
org.jsoup.nodes.Document document=org.jsoup.Jsoup.parse(url, timeout);
org.jsoup.select.Elements elements=document.select(tag);
java.util.Iterator<org.jsoup.nodes.Element> iterator=elements.iterator();
while(iterator.hasMore())
{
	org.jsoup.nodes.Element element=iterator.next();
	String value=element.attr(attribute);
	//weiterverarbeitung von value
}
in zeile 12 kannst du dann mit der value des attributes sonst was machen ... z.b. in eine weitere ArrayList<String> packen und daraus dann das hier als methode machen
Java:
public ArrayList<String> getAttributeValues(URL url, int timeout, String tag, String attribute)
{
	ArrayList<String> list=new java.util.ArrayList<String>();
	org.jsoup.nodes.Document document=org.jsoup.Jsoup.parse(url, timeout);
	org.jsoup.select.Elements elements=document.select(tag);
	java.util.Iterator<org.jsoup.nodes.Element> iterator=elements.iterator();
	while(iterator.hasMore())
	{
		org.jsoup.nodes.Element element=iterator.next();
		String value=element.attr(attribute);
		list.add(value);
	}
	return list;
}
das sollte in ungefähr das sein was du vorhast ...
über die returnte ArrayList kannst du dann wiederum mit Iterator<String> iterieren und dir die einzelnen werte holen ...
etwaige Exceptions musst du noch selbst behandeln *oder weiter werfen*
 
I

irgendjemand

Gast
wie gesagt : DOC LESEN ... hat schon bei vielen die probleme gelöst ...
btw : da die lib-doc zur 5.0er SE gelinkt wurde hättest du auch dort entsprechend zu den SE-klassen hilfe gefunden ...

aber gerade sowas wie List<?> was hier in deinem fall von nöten ist zählt eigentlich zu grundlagen ...
 
I

irgendjemand

Gast
naja kein problem ... hoffe nur was ich da so aus der doc zusammengebaut habe funktioniert auch wie gewünscht ...
eigentlich bin ich die doc stück für stück durchgegangen ... angefangen beim static Jsoup.parse(URL) und mich dann von dort aus vorgearbeitet ... geguckt welche methoden was als parameter erwarten und zurückliefern und wie man sinnvoll durch mehrere objekte gehen kann ...
das es dabei eine cast-klasse gibt welche List<?> als grundlagen-struktur hat hat das ganze natürlich vereinfacht
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
OnDemand XML desializing Attribute bringt nicht erwartetes Ergebnis Allgemeine Java-Themen 16
Splayfer Problem: no main manifest attribute Allgemeine Java-Themen 3
Junger_Basileus Attribute, Arrays, Schleifen Allgemeine Java-Themen 9
L xml node mit attribute auslesen Allgemeine Java-Themen 2
L Klassen Polymorphie:2 Attribute gleichen Namens in einem Objekt Allgemeine Java-Themen 6
D JSF Bean Attribute bei Seitenaufruf Allgemeine Java-Themen 6
B Mp3-Attribute auslesen & beschreiben Allgemeine Java-Themen 6
M PDF Drucker-Attribute hinterlegen Allgemeine Java-Themen 3
E Finale Attribute und Konstruktor Allgemeine Java-Themen 3
T [htmlparser.sourceforge.net] Attribute extrahieren Allgemeine Java-Themen 3
T Namenskonventionen für Objekt-Attribute Allgemeine Java-Themen 12
J Attribute eines Objekts in ByteArray Allgemeine Java-Themen 3
I Attribute in Textfile auslesen Allgemeine Java-Themen 13
G [JDK 6u2] - JAR Failed to load Main-Class manifest attribute Allgemeine Java-Themen 6
E Attribute in Interfaces möglich? Allgemeine Java-Themen 17
MQue Button Attribute setzen Allgemeine Java-Themen 14
F JSP XML ATTRIBUTE Allgemeine Java-Themen 2
H Nullpointer exception, Attribute in Label schreiben? Allgemeine Java-Themen 4
L Alle Attribute eines Source-Files auslesen Allgemeine Java-Themen 2
J Attribute beim Drucken ändern/ausstellen Allgemeine Java-Themen 8
A Dynamisch Attribute hinzufügen Allgemeine Java-Themen 3
B Zugriff auf Attribute/Methoden der init-Klasse Allgemeine Java-Themen 10
S Bookmark HTML Datei einlesen, alle Links erhalten und manche editieren..? (aktuell JSoup) Allgemeine Java-Themen 4
S HTML einer Webseite 1:1 so bekommen wie es auch der Browser anzeigt? Allgemeine Java-Themen 14
C Parsen einer sich updatenden Html mithilfe von jsoup Allgemeine Java-Themen 4
I HTML / XHTML Seite nach Excel exportieren. Suche Lib Allgemeine Java-Themen 12
F Kennt ihr eine Library um 2 HTML Seiten zu diffen? Allgemeine Java-Themen 8
K HTMLEditor HTML Text in Rich Text umwandeln Allgemeine Java-Themen 14
N Value Wert aus HTML-Button mittels thymeleaf spring an java übergeben Allgemeine Java-Themen 2
N Lottowebsite programmieren mittels Java, HTML,.... Allgemeine Java-Themen 7
S HTML den ich von einer URL hole nicht identisch mit dem HTML im Browser Allgemeine Java-Themen 1
M Html Seite auslesen Allgemeine Java-Themen 16
Developer_X Website HTML Code von HTTPS URL laden Allgemeine Java-Themen 0
L HTML Formular ausführen Allgemeine Java-Themen 1
J Auslesen Daten Java/HTML Allgemeine Java-Themen 15
A Applet in HTML einbinden Allgemeine Java-Themen 1
KeVoZ_ JSoup - HTML Tag entfernen Allgemeine Java-Themen 1
I HTML einer Website auslesen liefert nur head Allgemeine Java-Themen 6
perlenfischer1984 HTML Code decodieren Allgemeine Java-Themen 2
stylegangsta Mehrere html seiten einer Homepage einlesen und als Textdatei ausgeben Allgemeine Java-Themen 14
P HTML Text bearbeiten Allgemeine Java-Themen 1
A Probleme beim auslesen von Quelltext (HTML) Allgemeine Java-Themen 5
OnDemand String aus html einlesen Allgemeine Java-Themen 2
OnDemand Substring einer HTML Seite will nicht Allgemeine Java-Themen 5
S Applet in html laden; InvocationTargetException,.. nur warum ? Allgemeine Java-Themen 0
R HTML Tabelle durchsuchen Allgemeine Java-Themen 3
L Erste Schritte Eclipse und Lokal funktioniert - in HTML nicht! Allgemeine Java-Themen 2
T Keyword Highlighting in HTML Allgemeine Java-Themen 5
B Best Practice HTML Output Optimal implementieren Allgemeine Java-Themen 3
A jEditorPane Html Datei öffnen (code) Allgemeine Java-Themen 3
Y Applet/Html - Wie Java-Methode aufrufen, die einen Parameter erwartet? Allgemeine Java-Themen 3
H HTML Parsing errors Allgemeine Java-Themen 9
P Aktuellen HTML Code auslesen (von JS manipuliert) Allgemeine Java-Themen 3
M HTML-Code von Webseite über Browser oder Console auslesen?? Allgemeine Java-Themen 5
S Robuste Methode um Text von HTML code zu extrahieren..? Allgemeine Java-Themen 6
S Bekomme mit Scanner und URL keine Html-Seite ausgelesen Allgemeine Java-Themen 3
C JEditorPane langsam großes HTML Allgemeine Java-Themen 8
M html aus aktuellem Browserfenster mitlesen lassen Allgemeine Java-Themen 5
T Kann HTML Datei nicht lesen Allgemeine Java-Themen 3
S HTML-Quelltext nach bestimmter Stelle durchsuchen Allgemeine Java-Themen 2
B HTML Tags in Strings umwandeln Allgemeine Java-Themen 4
S BufferedReader/PrintWriter an einer HTML Allgemeine Java-Themen 6
T HTML Tag Position mittels Pattern ermitteln Allgemeine Java-Themen 7
M Wicket Html Allgemeine Java-Themen 2
S Fehler beim ausführen des HTML Allgemeine Java-Themen 7
S Fehler Applet-HTML Allgemeine Java-Themen 5
B suchfunktion in html integrieren Allgemeine Java-Themen 3
DEvent Wieso ist Javadoc mit Html Tags? Allgemeine Java-Themen 47
P RegEx mit HTML Parser für Java möglich? Allgemeine Java-Themen 10
B RTF zu HTML Allgemeine Java-Themen 3
S Von HTML-Seite den Titel bekommen Allgemeine Java-Themen 2
M .jar in HTML einbinden Allgemeine Java-Themen 5
H Kleiner HTML Parser (Facharbeit) Allgemeine Java-Themen 11
K iText, HTML Einrückung im Document, aber nicht im Paragraph Allgemeine Java-Themen 3
J Überprüfen ob URL eine HTML Datei referenziert Allgemeine Java-Themen 4
E Zeilenumbruch html Allgemeine Java-Themen 3
J URLs aus HTML Datei extrahieren Allgemeine Java-Themen 2
G Swing JEditorPaneAppender (Output im HTML-Format) Allgemeine Java-Themen 12
W Java Anwendung in HTML Allgemeine Java-Themen 2
M Html Unit Whitespace-Problem Allgemeine Java-Themen 4
J HTML-Sonderzeichen ersetzen Allgemeine Java-Themen 2
M HTML-Websiten verarbeiten Allgemeine Java-Themen 8
A Index Datei aus HTML-Dateien Allgemeine Java-Themen 7
S HTML => DOM - Welcher Parser für meine Zwecke? Allgemeine Java-Themen 3
I HTML Seite laden Allgemeine Java-Themen 6
W Saubere Lösung für das Auslesen einer Html Seite (Mehrsprachigkeit) Allgemeine Java-Themen 5
M String in Html Text umwandeln Allgemeine Java-Themen 2
S Formatierungen aus HTML-Dokument übernehmen und in Word docx schreiben Allgemeine Java-Themen 3
E HTML File mit Umlaute einlesen Allgemeine Java-Themen 8
T HTML Parser Allgemeine Java-Themen 7
E Regex HTML Tag und Inhalt löschen Allgemeine Java-Themen 4
S Swing mit JEditorPane per HTML auf Bilder in JAR zugreifen. Allgemeine Java-Themen 3
S Regulärer Ausdruck für HTML-Tag Allgemeine Java-Themen 18
H Java Methode zum HTML encodieren/decodieren Allgemeine Java-Themen 2
Daniel_L Bug in Copy-Funktion bei HTML-Editorpane? Allgemeine Java-Themen 4
M JApplet einbinden in HTML Allgemeine Java-Themen 19
F Problem mit regulären Ausdruck in Zusammenhang mit HTML Allgemeine Java-Themen 8
T JavaScript aus HTML im JEditorPane ausführen? Allgemeine Java-Themen 5
S PDF nach HTML oder XML Allgemeine Java-Themen 2
O Tastendrücke in verstecktes HTML-Formular schreiben Allgemeine Java-Themen 4

Ähnliche Java Themen

Neue Themen


Oben