A
anon
Gast
Hallo,
ich habe folgendes HTML-Dokument:
Wie kann ich mit RegEx nun zwischen "dt" und "dd" auslesen? Folgender Code funktioniert nicht:
Vielen Dank vorab,
anon
ich habe folgendes HTML-Dokument:
Code:
<dt>
<b class="sstime">5.30-9.00[/b]&<span class="cname">Das Erste</span>
</dt>
<dd>
[url="./fernsehen/sendung.html?cid=Ard&stime=2009-02-10%2005%3a30%3a00%2b01"]ZDF-Morgenmagazin[/url]
<i class="sktext">Vom Duett zum Duell: Merkel gegen Seehofer?
Europäischer Sicherheitskongress: Wie bedroht ist Deutschland?
Starkes Sicherheitsbedürfnis: Zulauf für Rechts bei Wahlen in Israel
Kritik am EU-Abkommen: Klagen gegen Verträge von Lissabon vor dem BVerfG
Adieu Schiefertafel: Bildungsmesse didacta setzt auf "White Board"
Berlinale
Sport: WM-Abfahrt Ski alpin: Endlich Medaille für Maria Riesch?
"Gestatten, Bundestrainer": Michael Kuhn, Trampolin[/i]
</dd>
....
<dt>
<b class="sstime">5.30-9.00[/b]&<span class="cname">ZDF</span>
</dt>
<dd>
[url="./fernsehen/sendung.html?cid=Zdf&stime=2009-02-10%2005%3a30%3a00%2b01"]ZDF-Morgenmagazin[/url]
<i class="sktext">Vom Duett zum Duell: Merkel gegen Seehofer?
Europäischer Sicherheitskongress: Wie bedroht ist Deutschland?
Starkes Sicherheitsbedürfnis: Zulauf für Rechts bei Wahlen in Israel
Kritik am EU-Abkommen: Klagen gegen Verträge von Lissabon vor dem BVerfG
Adieu Schiefertafel: Bildungsmesse didacta setzt auf "White Board"
Berlinale
Sport: WM-Abfahrt Ski alpin: Endlich Medaille für Maria Riesch?
"Gestatten, Bundestrainer": Michael Kuhn, Trampolin[/i]
</dd>
....
<dt>
<b class="sstime">5.30-10.00[/b]&<span class="cname">SAT.1</span>
</dt>
<dd>
[url="./fernsehen/sendung.html?cid=Sat1&stime=2009-02-10%2005%3a30%3a00%2b01"]Frühstücksfernsehen[/url]
</dd>
<hr>
<dt>
<b class="sstime">5.30-6.00[/b]&<span class="cname">DSF</span>
</dt>
<dd>
Sport Clips
</dd>
....
Wie kann ich mit RegEx nun zwischen "dt" und "dd" auslesen? Folgender Code funktioniert nicht:
Code:
String input = all.toString();
Pattern p = Pattern.compile("<dd[^>].*>(.*)</dd>");
Matcher m = p.matcher(input);
while ( m.find() ) {
System.out.println(input.substring(m.start(), m.end()));
System.out.println("***");
}
Vielen Dank vorab,
anon