Hallo zusammen!
Ich möchte mir gerne mit JSoup den Seitenquelltext einer Website holen.
Leider habe ich dabei das Problem, dass genau das div, das ich brauche,
über Javascript gesteuert wird...
Lasse ich mir den Quelltext mit Chrome anzeigen, sehe ich aber zb. den Inhalt des Divs -
Chrome scheint hier den bereits interpretierten Quelltext anzuzeigen.
Geht das auch irgendwie programmatisch?
Wichtiger Hinweis: Es handelt sich um eine Confluence - Seite.
Mein Aufruf startet ca. so:
Habe da schon mit userAgent etc. probiert, was mich aber nicht weitergebracht hat...
Auch andere Verfahren, um eine Website per Java auszulesen habe ich probiert, Scanner u.v.m.
Aber die zeigen mir alle nicht den vollständig interpretierten Code an.
Was kann ich tun?
Vielen Dank.
Ich möchte mir gerne mit JSoup den Seitenquelltext einer Website holen.
Leider habe ich dabei das Problem, dass genau das div, das ich brauche,
über Javascript gesteuert wird...
Lasse ich mir den Quelltext mit Chrome anzeigen, sehe ich aber zb. den Inhalt des Divs -
Chrome scheint hier den bereits interpretierten Quelltext anzuzeigen.
Geht das auch irgendwie programmatisch?
Wichtiger Hinweis: Es handelt sich um eine Confluence - Seite.
Mein Aufruf startet ca. so:
Java:
Document doc = Jsoup
.connect("https://confluence....")
.userAgent("Chrome/60.0.3112.113")
.get();
Habe da schon mit userAgent etc. probiert, was mich aber nicht weitergebracht hat...
Auch andere Verfahren, um eine Website per Java auszulesen habe ich probiert, Scanner u.v.m.
Aber die zeigen mir alle nicht den vollständig interpretierten Code an.
Was kann ich tun?
Vielen Dank.