Website Quelltext auslesen - Javaskripte im Hintergrund?

UncleChicken

Mitglied
Hi,
beim Versuch den Quelltext einer Seite auszulesen, komme ich leider nicht weiter.
Es werden wohl im Hintergrund Inhalte geladen. (Die Artikel eines shops)
Ich hatte es mit dem Framework jSoup versucht, leider ohne Erfolg. (Artikel haben immer gefehlt)
Beim weiteren googlen bin ich dann noch auf HTMLUNIT gestoßen, womit es eigentlich hätte gehen müssen... aber mir fehlen noch immer die benötigten Inhalte...

Hier mal beispielhaft die Methode
Code:
	public static void testGoogle() throws FailingHttpStatusCodeException, MalformedURLException, IOException, InterruptedException{
		WebClient webClient = new WebClient();
		HtmlPage currentPage = webClient.getPage("http://de.wikipedia.org/wiki/Google");
		String textSource = currentPage.asText();
		String xmlSource = currentPage.asXml();
		
		System.out.println(xmlSource);
		
		
	}

Hätte jemand eine Idee, woran das liegen könnte? Bzw. was ich noch machen könnte?

Vielen Dank schonmal
 
Beste Antwort
Das ist nicht sehr schwer. Über java.net.URL.openConnection erhältst du ein HttpURLConnection Objekt. Damit kannst du dann per setRequestMethod und setRequestProperty bestimmen welche Anfrage an den Server gesendet wird.
Du musst halt nur erst über die Entwicklertools deines Browsers feststellen, wie die Anfrage aussehen muss.

Qler

Mitglied
Hi UncleChicken,
ich kenn mich leider mit HTML Unit nicht wirklich aus, jedoch hatte ich auch schonmal ein ähnliches Problem wie du und habe dann Selenium benutzt, um eine sehr javascript intensive Website auszulesen.
Kommt natürlich immer auf den Anwendungsfall an, ob selenium benutzt werden kann, da selenium ein richtiges Browserfenster öffnet und dadurch keinen HTTP Aufruf in java simuliert sondern wirklich durch einen Browser rendern lässt.

Alternativ könntest du auch den AJAX/ Javascript call, den die Seite macht isolieren und dann manuell die benötigten Daten über den spezielleren GET/POST request abrufen.
 

DrZoidberg

Top Contributor
Erstmal solltest du die Entwickler tools deines Webbrowsers aufrufen (mit F12) und dann auf den Netzwerk Tab klicken. Dann lädst du die Seite des Shops neu und dein Brower sollte dir dann anzeigen welche Daten wie übertragen werden.
 

UncleChicken

Mitglied
Hallo!
Danke für deine Rückmeldung!
Gestern Nacht bin ich beim googlen noch auf HTMLUNIT Driver gestoßen. (was wohl Selenium entspricht?!)
Und damit scheints zu klappen... zumindest bin ich damit ein Stück weiter gekommen.

Ich bin noch nicht allzu erfahren, daher werde ich mir damit
Alternativ könntest du auch den AJAX/ Javascript call, den die Seite macht isolieren und dann manuell die benötigten Daten über den spezielleren GET/POST request abrufen.
wohl schwer tun?! :D
 
Zuletzt bearbeitet:

DrZoidberg

Top Contributor
Das ist nicht sehr schwer. Über java.net.URL.openConnection erhältst du ein HttpURLConnection Objekt. Damit kannst du dann per setRequestMethod und setRequestProperty bestimmen welche Anfrage an den Server gesendet wird.
Du musst halt nur erst über die Entwicklertools deines Browsers feststellen, wie die Anfrage aussehen muss.
 
Beste Antwort
Ähnliche Java Themen
  Titel Forum Antworten Datum
M Java Website Java Basics - Anfänger-Themen 2
M JAVA Programm in Website einbinden Java Basics - Anfänger-Themen 19
C Was ist nötig für ein Java-Programm auf Server für Website Java Basics - Anfänger-Themen 18
L Website Icon Java Basics - Anfänger-Themen 9
T Website auslesen Java Basics - Anfänger-Themen 2
Viktim Website auslesen Java Basics - Anfänger-Themen 8
M Website im Hintergrund laden Java Basics - Anfänger-Themen 5
M Website anzeigen Java Basics - Anfänger-Themen 4
J Tabelle aus Website einlesen [nicht im Quellcode] Java Basics - Anfänger-Themen 6
M Teile einer Website auslesen? Java Basics - Anfänger-Themen 2
R Benutzerzugriff nur auf eine Website einschränken Java Basics - Anfänger-Themen 9
N Website HTML mit JavaScript abrufen Java Basics - Anfänger-Themen 9
U Website parsen Java Basics - Anfänger-Themen 11
M Java RegEx bei Website?!? Java Basics - Anfänger-Themen 5
M JSON Datensätze aus Website in Tabelle Java Basics - Anfänger-Themen 17
R Daten von Applet an Website Java Basics - Anfänger-Themen 4
Nic.o Bei einer Website anmelden Java Basics - Anfänger-Themen 6
C Website in *.java einbinden?? Java Basics - Anfänger-Themen 5
C Website Bot programmieren Java Basics - Anfänger-Themen 2
C Website Crawler programmieren Java Basics - Anfänger-Themen 6
G Programm über Website starten Java Basics - Anfänger-Themen 20
N Java programm in website einfügen Java Basics - Anfänger-Themen 2
F Jar File in Website einbinden Java Basics - Anfänger-Themen 4
Z Daten aus Website auslesen Java Basics - Anfänger-Themen 17
K Änderungsdatum einer Website herausfinden Java Basics - Anfänger-Themen 6
Developer_X Durch JTextPane eine Website anzeigen Java Basics - Anfänger-Themen 4
S Programm mit Website verknüpfen Java Basics - Anfänger-Themen 3
Mal Bild Datei mit Tags von Website laden Java Basics - Anfänger-Themen 9
Developer_X Applet in Website einbringen Java Basics - Anfänger-Themen 30
L Zugriff auf Steuerelemente einer website Java Basics - Anfänger-Themen 2
G ActionListener zum öffnen einer website Java Basics - Anfänger-Themen 10
rambozola jars für website verwenden? Java Basics - Anfänger-Themen 23
R Website mit Java parsen Java Basics - Anfänger-Themen 4
S Suchfunktion auf offline Website Java Basics - Anfänger-Themen 5
U Website aufrufen in java Java Basics - Anfänger-Themen 8
B Mit Java eine Website "steuern" Java Basics - Anfänger-Themen 18
B Website öffnen Java Basics - Anfänger-Themen 5
J Quelltext mit komischen griechischen Zeichen Java Basics - Anfänger-Themen 4
J Java GUI- Objekte Position per Quelltext bestimmen Java Basics - Anfänger-Themen 4
V_Fynn03 Erste Schritte BubbleSort Quelltext funktioniert noch nicht Java Basics - Anfänger-Themen 1
F Webseiten Quelltext auslesen Java Basics - Anfänger-Themen 5
C Quelltext mit Formatierungs- und Style-Informationen versehen Java Basics - Anfänger-Themen 7
S HTML-Quelltext hinter HTTPS Java Basics - Anfänger-Themen 1
D Erste Schritte Suche Quelltext Java Basics - Anfänger-Themen 7
J QuellText Frage Java Basics - Anfänger-Themen 1
X Quelltext einen Tic Tac Toe Spiels erklären Java Basics - Anfänger-Themen 4
T Quelltext wird nicht compiliert obwohl er Fehlerfrei ist. Java Basics - Anfänger-Themen 4
O Java will mir den Quelltext nich zu Bytecode Compilieren Java Basics - Anfänger-Themen 24
J Quelltext einer Homepage auslesen Java Basics - Anfänger-Themen 14
R Problem mit Quelltext : Kommazeichen Java Basics - Anfänger-Themen 7
E Quelltext für Grafik verschwindet Java Basics - Anfänger-Themen 9
R Quelltext sachen rausfiltern Java Basics - Anfänger-Themen 16
R Input/Output Formular absenden und Quelltext auslesen Java Basics - Anfänger-Themen 5
A Komentieren von Quelltext Java Basics - Anfänger-Themen 12
D Quelltext richtig verstanden? Java Basics - Anfänger-Themen 7
E Korrekter Quelltext? Java Basics - Anfänger-Themen 17
F HttpURLConnection Fehler beim Quelltext holen Java Basics - Anfänger-Themen 6
K Erste Schritte quelltext hilfe anfänger Java Basics - Anfänger-Themen 8
M Quelltext auslesen und diesen in einen String schreiben Java Basics - Anfänger-Themen 3
G Internet-Zugriff // URL posten, Quelltext einlesen Java Basics - Anfänger-Themen 5
E Compiler-Fehler Quelltext aus Buch erzeugt Fehler Java Basics - Anfänger-Themen 3
H Methoden Problem mit get-methode im Quelltext Java Basics - Anfänger-Themen 17
B Quelltext einlesen Java Basics - Anfänger-Themen 12
L Quelltext von vorgefertigten Klassen ansehen Java Basics - Anfänger-Themen 4
StrikeTom Quelltext einer Internetseite auf JTextArea anzeigen Java Basics - Anfänger-Themen 4
K Passage im Quelltext verstehen Java Basics - Anfänger-Themen 2
M Quelltext kürzen Java Basics - Anfänger-Themen 8
F Aus UML Diagramm Quelltext Java Basics - Anfänger-Themen 7
A Quelltext Java Basics - Anfänger-Themen 21
N kommentierter Quelltext zum Üben erwünscht Java Basics - Anfänger-Themen 6
R Quelltext einfügen und kompilieren Java Basics - Anfänger-Themen 4
D Quelltext zu vereinfachen? Java Basics - Anfänger-Themen 4
G Mit Java Quelltext auf Element untersuchen. Java Basics - Anfänger-Themen 5
G Brauche ein paar erklärungen zu Quelltext Java Basics - Anfänger-Themen 5
Y Einfachen Quelltext in UML darstellen mit Eclipse Java Basics - Anfänger-Themen 8
M Quelltext - Urls filtern Java Basics - Anfänger-Themen 4
S Verständnissprobleme mit Quelltext - Make Typ Java Basics - Anfänger-Themen 13
G Quelltext von Methoden in der Klasse Math Java Basics - Anfänger-Themen 11
D Quelltext schützen ? Java Basics - Anfänger-Themen 16
M quelltext html-seite speichern + links speichern Java Basics - Anfänger-Themen 2
B NSD-Diagramme aus Java-Quelltext erstellen! Java Basics - Anfänger-Themen 3
P Quelltext nicht kompilierbar Java Basics - Anfänger-Themen 15
I translate.java - kein sichtbarer fehler im quelltext Java Basics - Anfänger-Themen 18
L Quelltext problem Java Basics - Anfänger-Themen 46
G Quelltext compilieren und öffnen Java Basics - Anfänger-Themen 11
M Quelltext vom Applet Java Basics - Anfänger-Themen 20
M brauche hilfe mit folgendem quelltext Java Basics - Anfänger-Themen 7
V Quelltext einer Homepage einlesen Java Basics - Anfänger-Themen 12
N Quelltext durchsuchen ggfls Alarm schlagen. Java Basics - Anfänger-Themen 29
L quelltext kompilieren Java Basics - Anfänger-Themen 2
G eigenen Quelltext ausgeben Java Basics - Anfänger-Themen 8
G Html Quelltext auslesen der passwortgeschützt ist Java Basics - Anfänger-Themen 4
R Quelltext einer HTML-Seite auslesen Java Basics - Anfänger-Themen 2
M Wo liegt der Quelltext von System.out.println() Java Basics - Anfänger-Themen 3
M Handy Programm, kompletter Quelltext.Methodische Fehler? Java Basics - Anfänger-Themen 3
S Quelltext mit Fehlern Java Basics - Anfänger-Themen 12
U Abkürzung in Quelltext :(( Java Basics - Anfänger-Themen 7
S Daten aus Import Datei auslesen und sortieren Java Basics - Anfänger-Themen 2
T array auslesen Java Basics - Anfänger-Themen 2
I Klassen von einem package laden, Statisches Feld auslesen und Objekt erstellen Java Basics - Anfänger-Themen 8

Ähnliche Java Themen

Neue Themen


Oben