K
Katjushka
Gast
hallo, leute. Ich habe folgende Hausaufgabe: ich muss auf eine Webseite gehen, da einen Link auf das Impressum finden und dem Link folgen (keine Angst: bin keine Spam-Verteilerin
) Nun habe ich die Seite durchgescannt und tokeniziert. Nach einem RegEx
hat die folgende Zeile gematcht
Jetzt möchte ich natürlich das "impressum.html" aus dieser Zeile extrahieren. Gibt es denn eine Möglichkeit innerhalb eines Strings zu matchen und das gematchte gleich in einer Variable zu speichern? Ich weigere mich an dieser Stelle den String einfach weiter nach " oder einem sonstigen Zeichen zu splitten, weil ich nicht weiß, was alles für Quellcode im Netz zu finden ist, kann ja sein, dass es nirgendwo sonst dann passen wird.
Danke
Code:
".*[Ii]mpressum.*"
.href="./impressum.html"><img
Jetzt möchte ich natürlich das "impressum.html" aus dieser Zeile extrahieren. Gibt es denn eine Möglichkeit innerhalb eines Strings zu matchen und das gematchte gleich in einer Variable zu speichern? Ich weigere mich an dieser Stelle den String einfach weiter nach " oder einem sonstigen Zeichen zu splitten, weil ich nicht weiß, was alles für Quellcode im Netz zu finden ist, kann ja sein, dass es nirgendwo sonst dann passen wird.
Danke