Webseiten Quelltext auslesen

Diskutiere Webseiten Quelltext auslesen im Java Basics - Anfänger-Themen Bereich.
F

Fohnbit

Hallo,

mittels Firefox und Marionette lese ich eine Webseite aus, nachdem diese komplett mit allen Javascripts geladen wurde.
Das paßt auch alles.

Aber ich ich im body dieses Javascript:
Javascript:
<script type="text/x-magento-init">
    {
        "[data-gallery-role=gallery-placeholder]": {
            "mage/gallery/gallery": {
                "mixins":["magnifier/magnify"],
                "magnifierOpts": {"fullscreenzoom":"20","top":"","left":"","width":"","height":"","eventType":"hover","enabled":false},
                    "options": {
                    "nav": "thumbs",
                    "loop": true,
                    "keyboard": true,
                    "arrows": true,
                    "allowfullscreen": true,
                    "showCaption": false,
                    "width": "700",
                    "thumbwidth": "90",
                                            "thumbheight": 90,
                                             "height": 700,
                                             "transitionduration": 500,
                     "transition": "slide",
                    "navarrows": true,
                    "navtype": "slides",
                    "navdir": "horizontal"
                },
                "fullscreen": {
                    "nav": "thumbs",
                    "loop": true,
                    "navdir": "horizontal",
                    "navarrows": false,
                    "navtype": "slides",
                    "arrows": false,
                    "showCaption": false,
                                            "transitionduration": 500,
                     "transition": "dissolve"
                },
                "breakpoints": {"mobile":{"conditions":{"max-width":"767px"},"options":{"options":{"nav":"dots","navigation":"dots"}}}}            }
        }
    }</script>
mit:
Java:
Document doc = Jsoup.parse(fox1.getPageSource());
Elements script = doc.select("script");
for (int i = 0; i < script.size(); i++) {
                String s = script.get(i).text();
                if (s.contains("allowfullscreen"))
                    System.out.println(script.get(i).text());
            }
jedoch erhalte ich viele scripte, aber das gewünschte ist nicht dabei.
 
mihe7

mihe7

Das ist möglich, da die JavaScripts ja Elemente erstellen können. Wenn Du es wie im Browser haben willst, brauchst Du etwas wie Selenium.
 
F

Fohnbit

Hallo mihe7,

ja, das habe ich:
Java:
fox1 = new FirefoxDriver();
Aber ich finde das nicht. Öffne ich die URL im Broswer und sehe ich den Quellcode an, ist er da.

Wie könnt ich das script auslesen? Oben habe ich ja nach "script" gesucht und habe viele treffer, aber nicht das gewünschte.
 
mihe7

mihe7

Versuch mal über den WebDriver nach dem Element zu suchen und nicht über jsoup.
 
Thema: 

Webseiten Quelltext auslesen

Passende Stellenanzeigen aus deiner Region:
Anzeige

Neue Themen

Anzeige

Anzeige
Oben