Regex Problematik

Status
Nicht offen für weitere Antworten.
G

Gast

Gast
Hi,

ich hab folgendes Problem ...

Angenommen ich habe eine HTML Seite auf der ich mittels eines Regulären Ausdrucks einen Anfang gesucht habe. Bis hierhin funktioniert auch alles soweit super!
Jetzt habe ich aber das Problem, dass mit dem regulären Ausdruck den ich geschrieben habe, nicht der erste letzte Tag gesucht wird, sondern der komplett letzte Tag des ganzen HTML ...


Hier ein Teil des HTML das ich verwende:

Code:
String html = "rests')\">Interests</a>:</td>" +
		"<td class=\"data\"><div id='Interests-data'class=\"datawrap\"><a href=\"http://www.test.com/s.php?adv&k=100000010&n=-1&in=w" +
				"atching%20tv&o=4\">watching tv</a>
<a href=\"http://www.test.com/s.php?adv&k=100000010&n=-1&in=living%20like%20in%20" +
				"the%20good%20old%2020th%20century&o=4\">living like in the good old 20th century</a>
<a href=\"http://www.test.com/s" +
				".php?adv&k=100000010&n=-1&in=playing%20the%20holophon&o=4\">playing the holophon</a></div></td></tr><tr id=\"Movies\"><td class=" +
				"\"label\"><a href=\"javascript:editProfileRow('Movies')\">Favorite Movies</a>:</td><td class=\"data\"><div id='Movies-data'class=\"" +
				"datawrap\"><a href=\"http://www.test.com/s.php?adv&k=100000010&n=-1&mv=Futurama&o=4\">Futurama</a>, <a href=\"http://www.test" +
				".com/s.php?adv&k=100000010&n=-1&mv=Simpsons&o=4\">Simpsons</a>, <a href=\"http://www.test.com/s.php?adv&k=100000010&n=-1&mv=30th" +
				"%20Century&o=4\">30th Century</a></div></td></tr><tr id=\"Qu


Hier ist mal der Regex den ich verwende:

Code:
String regex_interests = "(Interests)+?</a>:</td>(.*)[</a></div>]+?";

Also ich bekomme alles was ab Interests</a>:</td> anfängt. Allerdings hört es auch erst ganz zum Schluss auf.
Das heißt also ich bekomme alles ab

Interests: --> living like in the good old 20th century, playing the holophone
und zusätzlich auch noch bis
Favorite Movies: --> Futurama, Simpsons, 30th Century
bis zum </a></div>

Gibt es jetzt eine Möglichkeit, dass ich dem RegEx sagen kann, dass er das nächste </a></div> nach Interests verwenden soll und nicht das letzte am Ende des Dokuments ????

Fragen über Fragen .
Hoffe ihr habt verstanden was ich wollte und könnt mir weiterhelfen.
Schon mal Danke im Vorraus!
 
G

Gast

Gast
Hat sich zwar so ganz gut angehört, allerdings funktioniert es leider nicht. Ich denke ich weiß auch wieso.

Es liegt glaub ich an dem (.*) das ich vor dem [</a></div>]+? stehen habe. Allerdings weiß ich nicht, wie ich es sonst machen sollte, da ich nicht genau weiß, wieviel Text zwischen dem </td> ... und dem </a> .. genau steht. Das ist hier halt ganz variabel.

Ich hab jetzt mit folgenden RegEx probiert:
Code:
String regex_movies = 
"(Interests)+?</a>:</td>(.*)[</a></div>]{1}";
 
G

Gast

Gast
String regex_movies =
"(Interests)+?</a>:</td>([^<])*[</a></div>]{1}";



(.*) -> ([^<])*
 
G

Gast

Gast
Funktioniert leider auch nicht ... bin mit meinem Latein am Ende ...
Ich frag mal anders...

Wie würdet ihr einen regulären Ausdruck schreiben, bei dem man nur die Interessen und die dazugehörigen Eigenschaften bekommen würde. hier also:

Interests: --> living like in the good old 20th century, playing the holophone

Die Eigenschaften können Sich hierbei natürlich unterscheiden und sind alle auch weiterhin verlinkt. Die Links dazu brauch ich aber nicht. Beispiel ist der oben angegebenen Quelltextausschnitt. Oder habt ihr einen ganz anderen Vorschlag.
 
S

SlaterB

Gast
Code:
public class Test
{

    public static void main(String[] args)
        throws Exception
    {
        String html = ..;
        html = html.replaceAll("</a></div>", "#");
        String regex_interests = "Interests</a>:</td>([^#]*)#";

        Pattern p = Pattern.compile(regex_interests);
        Matcher m = p.matcher(html);
        m.find();
        System.out.println(m.group(1));

    }
}
 
S

SlaterB

Gast
aber es sollen durchaus einige < übersprungen werden,
nur kein "</a></div>", alles bis zum ersten "</a></div>"
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
H Frage regex greater than less than Allgemeine Java-Themen 7
N Regex schlägt nicht an Allgemeine Java-Themen 10
W Variable Initialisierung mit dem Ergebnis einer Regex Allgemeine Java-Themen 1
T regex case insensitive trimmed Allgemeine Java-Themen 6
S Zeichen | in regex Allgemeine Java-Themen 8
X Regex mit mehreren Bedingungen machen Allgemeine Java-Themen 5
N Hilfe bei RegEx benötigt Allgemeine Java-Themen 3
C Java17 und Regex Allgemeine Java-Themen 13
OnDemand RegEx /compilebekomme nicht die erwarteten Werte Allgemeine Java-Themen 9
N Gierigen Regex in nicht-gierigen umwandeln Allgemeine Java-Themen 4
N E-Mail Validator (ohne Regex!) Allgemeine Java-Themen 7
OnDemand Regex von bis Allgemeine Java-Themen 6
W Versionsnummer auslesen - Regex ist zickig Allgemeine Java-Themen 2
L RegEx für Teile einer Berechnung Allgemeine Java-Themen 14
G Regex Allgemeine Java-Themen 2
L regex ganzer string? Allgemeine Java-Themen 2
MiMa Geldbetrag mit regex ermitteln. Allgemeine Java-Themen 14
W RegEx Stringliteral finden - Jflex Allgemeine Java-Themen 5
D Regex Probleme Allgemeine Java-Themen 2
Kirby.exe Regex charakter ignorieren Allgemeine Java-Themen 12
S Java SAT (Haltbarkeitsproblem) mit Regex Allgemeine Java-Themen 6
S [Regex] Nur diese Zeichen beachten Allgemeine Java-Themen 1
M Bitte Hilfe mit REGEX (Negieren) Allgemeine Java-Themen 4
J Compilerfehler bis in java.util.regex.Pattern... Allgemeine Java-Themen 2
C PDFBox: Nach RegEx ganze Zeile Allgemeine Java-Themen 4
S Regex mit UND-Verknüpfung Allgemeine Java-Themen 1
P RegEx für Zeiten Allgemeine Java-Themen 7
D Regex: Komplettes Wort bekommen Allgemeine Java-Themen 3
Neumi5694 Operatoren regEx für das Erstellen eines Strings verwenden Allgemeine Java-Themen 3
P RegEx Allgemeine Java-Themen 3
W String Parsen und auf eigenes Muster anwenden (kein Regex) Allgemeine Java-Themen 11
Y regex | n-faches Vorkommen oder gar keins Allgemeine Java-Themen 6
turmaline Regex gegen Regex prüfen Allgemeine Java-Themen 4
HarleyDavidson Regex - Optimierung Allgemeine Java-Themen 4
M Regex für Zahleneingabe in JavaFX Textfield Allgemeine Java-Themen 18
T Best Practice Wortregeln RegEx Allgemeine Java-Themen 11
A ALTER TABLE mit Hilfe von RegEx zerlegen, splitten Allgemeine Java-Themen 5
H Interpreter-Fehler Regex kompiliert nicht Allgemeine Java-Themen 5
M RegEx alle Matches ausgeben Allgemeine Java-Themen 5
Iron Monkey Mit Regex nach Beträge suchen Allgemeine Java-Themen 4
T REGEX Erklaerung Allgemeine Java-Themen 14
T Nur innerhalb des regex-Match ersetzen Allgemeine Java-Themen 9
H Pic Download / Regex Problem Allgemeine Java-Themen 7
F Frage zu Regex möglich Allgemeine Java-Themen 4
M Regex... mal wieder Allgemeine Java-Themen 3
H RegEx - Ersetze alles bis Leerzeichen Allgemeine Java-Themen 5
S regex verbrät CPU Allgemeine Java-Themen 6
V Regex Bereichs Filter Allgemeine Java-Themen 4
127.0.0.1 RegEx _ und 0-9 Allgemeine Java-Themen 45
S Entfernen von allen Nicht-Buchstaben chars aus einem String ohne Regex..? Allgemeine Java-Themen 10
P Java String Regex Allgemeine Java-Themen 2
AyKay Regex XPath Allgemeine Java-Themen 4
C Regex (Case insensitive und Umlaute) Allgemeine Java-Themen 4
D Regex Raute erkennen Allgemeine Java-Themen 2
nrg Zweistelligen Zahlenbereich mit RegEx Allgemeine Java-Themen 8
GilbertGrape Regex-Problem Allgemeine Java-Themen 2
W Denkblockade RegEx Allgemeine Java-Themen 2
S eigene regEx schreiben Allgemeine Java-Themen 4
C Regex expandieren Allgemeine Java-Themen 6
C Regex Überschniedung von Ausdrücken Allgemeine Java-Themen 16
reibi RegEX - Teilstring Allgemeine Java-Themen 6
R Java-RegEx terminiert nicht Allgemeine Java-Themen 3
M Regex: Ich stehe auf dem Schlauch Allgemeine Java-Themen 2
V Kleines Regex-Problem Allgemeine Java-Themen 3
B Regex "Problem" Allgemeine Java-Themen 4
B RegEx: (Um-)formulieren eines Pattern zur Identifizierung komplexer URLs Allgemeine Java-Themen 7
P RegEx mit HTML Parser für Java möglich? Allgemeine Java-Themen 10
J Regex: Fertige URLS aus Javascript Allgemeine Java-Themen 3
N Java regex Allgemeine Java-Themen 5
K Regex JSON Allgemeine Java-Themen 3
J RegEx Ausdruck Allgemeine Java-Themen 2
J Regex: URLS aus CSS Allgemeine Java-Themen 2
G RegEx- Ausdruck Allgemeine Java-Themen 4
G RegEx kein Unterstrich Allgemeine Java-Themen 2
A Text via RegEx durchsuchen und teile ersetzten Allgemeine Java-Themen 5
C Regex: Zahl ohne führende Null Allgemeine Java-Themen 13
W RegEx Zeile parsen Medium Allgemeine Java-Themen 8
X Java String Regex - Sonderzeichen Filtern Allgemeine Java-Themen 5
S Dateiname mit Regex parsen Allgemeine Java-Themen 3
Loyd Noch ne Regex-Frage: Verschachtelte Ausdrücke Allgemeine Java-Themen 4
R Java Regex Frage Allgemeine Java-Themen 17
Daniel_L RegEx-Frage: Ersetzen in UBB ausschließen Allgemeine Java-Themen 2
M Große Datei mit Regex durchsuchen Allgemeine Java-Themen 4
S regex für einen Link Allgemeine Java-Themen 3
E Regex alles nach ? löschen Allgemeine Java-Themen 4
M RegEx-Frage Allgemeine Java-Themen 2
R Regex Tokenizer Allgemeine Java-Themen 11
E Regex HTML Tag und Inhalt löschen Allgemeine Java-Themen 4
H RegEX und eMail Allgemeine Java-Themen 4
L-ectron-X Regex zum Entfernen von mehrzeiligen Kommentaren Allgemeine Java-Themen 2
martin82 Regex - JTable - Filter Allgemeine Java-Themen 10
nrg Kleine Hilfe mit RegEx Allgemeine Java-Themen 2
B Regex-Fehler nach lib-Update Allgemeine Java-Themen 2
K Contrains oder Regex Allgemeine Java-Themen 3
J replaceAll , "[", "]" & regex Allgemeine Java-Themen 12
P RegEx und $-Zeichen als Literal Allgemeine Java-Themen 5
P RegEx - Worte ausschließen Allgemeine Java-Themen 8
S Regex - was isst denn {javaLetter} und {javaDigit}? Allgemeine Java-Themen 2
D Wie werden Regex-Gruppen kompiliert? Allgemeine Java-Themen 2
Stillmatic RegEx Matches ausgeben Allgemeine Java-Themen 10

Ähnliche Java Themen

Neue Themen


Oben