String zerlegen mittels regulärem Ausdruck

Status
Nicht offen für weitere Antworten.

xray200

Mitglied
Hallo zusammen,

ich versuche einen String mit regulären Ausdrücken zu zerlegen, um dann die einzelnen Teile weiterzuverarbeiten.
Mein regulärer Ausdruck ist sehr komplex, aber im Grunde geht es um folgendes (Tokenizer reicht also nicht aus):

Dieses Beispiel funktioniert, ich habe es aus Java ist eine Insel:

String s = "Url := http://java-tutor.com";
Scanner scanner = new Scanner( s ).useDelimiter( "\\s*:=\\s*" );
System.out.println( scanner.next() ); // Url
System.out.println( scanner.next() ); // Java Seminare und IT-Schulungen (.NET, XML, Datenbanken, Office und mehr) | tutego

Bei meinen regulären Ausdrücken gibt es kein "\\s*" sondern nur ".+".
Damit scheint es mit diesem Beispiel nicht zu funktionieren, wenn ich aus \\s* schon \\s+ mache, kann ich die einzelnen Teile nicht mehr ausgeben.

Habt ihr eine Idee?
 

xray200

Mitglied
Also mein Ziel ist es, die Zerlegung anhand von RegExs zu machen, da ich diese bereits verwenden, um das Format des String zu prüfen.

Es sind mehrere, ein Beispiel:

(begin.+(weiter.+)*ende.+)

Ich würde nun gern die .+ Teile über Scanner und has next verarbeiten.
 

xray200

Mitglied
Also mein Ziel ist es, die Zerlegung anhand von RegExs zu machen, da ich diese bereits verwenden, um das Format des String zu prüfen.

Es sind mehrere, ein Beispiel:

(begin.+(weiter.+)*ende.+)

Ich würde nun gern die .+ Teile über Scanner und has next verarbeiten.

Update: da die obige RegEx so nicht funktioniert, da die Weiter-Teile überlesen werden, nehmen wir einfach nur:

(begin.+ende.+)

Wie kann ich die .+ Teile anhand der RegEx auslesen?
 

Michael...

Top Contributor
Habe ich das richtig verstanden Deine Trennzeichen sind 'begin', 'weiter' und 'ende'?
Da ich mit 1.4 arbeite habe ich nicht viel Erfahrung mit der Scanner Klasse
aber da das Teilen mit
Code:
String.split("begin|weiter|ende")
funktioniert, vielleicht funktioniert, dann auch folgendes:
Java:
Scanner scanner = new Scanner(input).useDelimiter("begin|weiter|ende");
	while(scanner.hasNext()) {
		System.out.println( scanner.next() );
}
Ob der String korrekt aufgebaut ist wird ja schon vorher geprüft, oder?
 

xray200

Mitglied
Habe ich das richtig verstanden Deine Trennzeichen sind 'begin', 'weiter' und 'ende'?
Da ich mit 1.4 arbeite habe ich nicht viel Erfahrung mit der Scanner Klasse
aber da das Teilen mit
Code:
String.split("begin|weiter|ende")
funktioniert, vielleicht funktioniert, dann auch folgendes:
Java:
Scanner scanner = new Scanner(input).useDelimiter("begin|weiter|ende");
	while(scanner.hasNext()) {
		System.out.println( scanner.next() );
}
Ob der String korrekt aufgebaut ist wird ja schon vorher geprüft, oder?

das Begin, weiter, ende ist nur ein sehr einfaches Beispiel. Ich habe viele RegExs, die sehr komplex sind.
Damit prüfe ich die Syntax und dann möchte ich die einzelnen Teile auslesen.
Es muss nicht die Scanner-Klasse dafür sein, mir gelingt es nur nicht, die Teile, die ich mit ".+" kennzeichne, auszulesen.
Ich nehme an, das funktioniert dann anders. Aber wie? :)
 
B

bygones

Gast
gruppieren die "Teile" die du haben willst, hol dir einen Matcher und iteriere ueber die matches und deren Gruppe.
 
B

bygones

Gast
funktioniert mit matcher und mit scanner
Java:
public class K {

    public static void main(String[] args) {
        String s = "Begin hier steht nun irgendwas Weiter was anderes End";
        
        Pattern pattern = Pattern.compile("Begin(.+)Weiter(.+)End");
        Matcher matcher = pattern.matcher(s);
        while (matcher.find()) {
            System.out.println(matcher.group(1));
            System.out.println(matcher.group(2));
        }
        
        Scanner scanner = new Scanner(s);
        scanner.useDelimiter("Begin|Weiter|End");
        while (scanner.hasNext()) {
            System.out.println(scanner.next());
        }
    }
}
beim matcher bzw dessen Pattern gibt man halt an was man haben will und beim Scanner was die Begrenzungen sind...
 

Wildcard

Top Contributor
Regex:
Code:
begin(.+?)(weiter(.+?))*ende(.+)
Auf die Gruppen (Klammern markieren Gruppen) kommst du dann mit Matcher.group(number)
 

Landei

Top Contributor
das Begin, weiter, ende ist nur ein sehr einfaches Beispiel. Ich habe viele RegExs, die sehr komplex sind.

Schonmal daran gedacht, einen "richtigen" Lexer zu bemühen? Wenn es wirklich komplizierter wird, sind RexEx nur eine besonders schmerzhafte Form des Masochismus, und Parser-Generatorn wie ANTLR, JavaCC usw. das Mittel der Wahl.
 

xray200

Mitglied
funktioniert mit matcher und mit scanner
Java:
beim matcher bzw dessen Pattern gibt man halt an was man haben will und beim Scanner was die Begrenzungen sind...[/QUOTE]

Das Matcherbeispiel ist ideal, aber ich bekomm es nicht hin:

[code=Java]

Matcher matcher = pattern.matcher(s);
Boolean b=m.matches();

       while (m.find()) {
				for (int i=1;i<=m.groupCount();i++){
					System.out.println(i);
				}
	        }

Bei meiner RegEx ist der Vergleich, Variable b, True, aber find() immer False.
Wie kann das sein?
Es gibt das Muster nur 1x, also der Text insgesamt ist das Muster, kann dann find() überhaupt True werden?
 

xray200

Mitglied
Ich möchte zuerst prüfen, ob der komplette String mit der RegEx übereinstimmt und falls ja, dann die einzelnen Teile der RegEx auslesen.

Wie mache ich es dann?

Java:
if (m.find()==true) {	for (int i=1;i<=m.groupCount();i++){
					System.out.println(i);
					ergebnisliste.add(m.group(i));
				}
}

Da der gesamte Text der RegEx entsprechen muss, also nur 1x gefunden werden kann, müsste das so passen oder?
 
B

bygones

Gast
find gitb an ob der Regex gefunden wurde, matches gibt an ob er Komplett gematcht hat.

also wenn du restriktiv bist und sagst der string darf NUR komplett vom regex abgedeckt sein dann
Java:
 if(m.matches()) {
  for...
}
 

xray200

Mitglied
OK, dann geht es mit matches. Allerdings bekomme ich bei folgendem RegEx nur die zweite Gruppe ausgegeben.
Die group(i) beginnt doch ab 1, weil 0 doch den gesamten String enthält.

Regex: [^t]+t[e]+e
Beispieltext: 1ct3e

Bekomme ich nur die "3" vor dem e, als group(1), aber nicht 1ct. Warum nicht?
 

xray200

Mitglied
Wie ist es denn mit Verschachtelten Gruppen. Wie reagiert group(i)?
Nimmt es nur die oberste Hierarchieebene der Gruppen oder alle?

Also Bsp: ((e)*)?
 
B

bygones

Gast
meinst du sowas
Java:
String s = "huhu cdfr cdcd";
        Pattern pattern = Pattern.compile("([^c|d]+)");
        Matcher matcher = pattern.matcher(s);
        while(matcher.find()) {
            System.out.println(matcher.group(1));
        }
gibt huhu und fr aus
 

xray200

Mitglied
meinst du sowas
Java:
String s = "huhu cdfr cdcd";
        Pattern pattern = Pattern.compile("([^c|d]+)");
        Matcher matcher = pattern.matcher(s);
        while(matcher.find()) {
            System.out.println(matcher.group(1));
        }
gibt huhu und fr aus

Aber ich möchte ja "c" und "d" als einzelne Buchstaben nicht eliminieren.
Mit deinem Vorschlag erhalte ich aus ccdd nichts, obwohl ich c und d am Anfang und am Ende ja haben will.
Ich möchte einfach analog zu [^c] also dem Verbot eines Buchstabens, die Buchstabenfolge "cd", undzwar nur diese, verbieten.

Wie mache ich das am besten?
 
B

bygones

Gast
ich muss gestehen ueber Pattern weiss ich das jetzt auch nicht.

mit dem Scanner klappt das
Java:
String s = "huhu cdfr ccdd";
Scanner scanner = new Scanner(s);
scanner.useDelimiter("cd");
while (scanner.hasNext()) {
    System.out.println(scanner.next());
}
Java:
huhu 
fr c
d

ich bezweifle mal dass das aber auch nicht wirklich das ist was du suchst...
 

xray200

Mitglied
Ich suche zum Ein-Zeichen-Verbot [^c]+ das analoge für mehrere Zeichen als Zeichenfolge, wobei [^(cd)] nicht funktioniert.

Hat da jemand eine Idee, wie man das in RegeEx macht?
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
F String in feste Größe zerlegen Allgemeine Java-Themen 11
H String zerlegen Allgemeine Java-Themen 2
J String zerlegen in einzelne Strings Allgemeine Java-Themen 7
D String zerlegen Allgemeine Java-Themen 12
N String in einzelne Zeichen zerlegen Allgemeine Java-Themen 8
K String zerlegen wie? Allgemeine Java-Themen 8
S String analysieren, zerlegen und überarbeiten Allgemeine Java-Themen 4
Luma String in seine Buchstaben zerlegen? Allgemeine Java-Themen 3
M String zerlegen? Allgemeine Java-Themen 2
OnDemand Java String in Hashmap als Key NULL Allgemeine Java-Themen 27
JAnruVA Datentypen Berechneten String-Wert in Double umwandeln um weiter zu rechnen Allgemeine Java-Themen 7
M String Allgemeine Java-Themen 10
M Suche nach String mit unbekannten characters Allgemeine Java-Themen 53
kodela String kann nicht zu Pfad konvertiert werden Allgemeine Java-Themen 16
melaniemueller Einzelne Zeile aus einer txt Datei in einem String speichern Allgemeine Java-Themen 12
E Objekte in einen String packen und wieder laden Allgemeine Java-Themen 5
M Map<String,String>funktioniert nicht richtig Allgemeine Java-Themen 4
O String in Long Hexerdezimal umwandel Allgemeine Java-Themen 14
N String vergleichen. Allgemeine Java-Themen 27
P String.replace() funktioniert nicht? Allgemeine Java-Themen 3
SaschaMeyer Arbeitet String.split falsch? Allgemeine Java-Themen 4
M Switches ohne String Allgemeine Java-Themen 18
AmsananKING String Iteration Allgemeine Java-Themen 5
S Shuffle String aus if-clause Allgemeine Java-Themen 11
Besset Variablen Ist String = "" + int inordnung? Allgemeine Java-Themen 6
M Map <Long, String> zu Map<String, Long> Allgemeine Java-Themen 9
S String Encoding Verständnisproblem Allgemeine Java-Themen 22
N Prüfen, ob ein String 2x das selbe Zeichen hat Allgemeine Java-Themen 10
SaftigMelo Bug Fixen von String-spliten Allgemeine Java-Themen 8
Monokuma String List nach Zahlen und Worten sortieren Allgemeine Java-Themen 9
Kingamadeus2000 Alle mehrfach vorkommenden Buchstaben rekursiv aus einem String entfernen. Allgemeine Java-Themen 6
YohnsonM String - Aufteilung und Nutzung einzelner Chars Allgemeine Java-Themen 7
O Formatierte String ausgabe bei vier Variablen in einer Zeile Allgemeine Java-Themen 1
S String umbenennen: wie? Allgemeine Java-Themen 4
x46 String Format Fehler Allgemeine Java-Themen 2
S ISO 8601 -> getter / setter String Allgemeine Java-Themen 3
L String zu repräsentativen Wert Allgemeine Java-Themen 0
H Array mit dem Datentype String[] initializieren Allgemeine Java-Themen 7
L ArrayList mit String Arrays in ein Array umwandeln Allgemeine Java-Themen 1
L regex ganzer string? Allgemeine Java-Themen 2
L Ist ein string ein erlaubter variabel name? Allgemeine Java-Themen 2
Z JNA Cpp-DLL String Verwendung Allgemeine Java-Themen 2
A String auf Zahlen überprüfen Allgemeine Java-Themen 5
N String Array Eingabe Allgemeine Java-Themen 6
MiMa Datum von String zu LocalDateTime Allgemeine Java-Themen 8
W String -> byte[] -> String - Sieht jemand was ich nicht sehe? Allgemeine Java-Themen 10
R char aus String entfernen Allgemeine Java-Themen 10
LimDul Mittels Streams aus Strings A B C den String A, B und C machen Allgemeine Java-Themen 12
M Programm erkennt String aus .txt Datei nicht Allgemeine Java-Themen 3
P einen public <Optinal String> in einer anderen Klasse mit einem Int vergleichen Allgemeine Java-Themen 2
S Ini Text aus String parsen Allgemeine Java-Themen 1
T String-Manipulation beim Ablauf in Eclipse und als JAR-File Allgemeine Java-Themen 8
M String lässt sich nicht Zusammenfügen Allgemeine Java-Themen 10
Drachenbauer Wie kann ich das Wort "concrete" in einem String durch ein anderes Wort ersetzen lassen? Allgemeine Java-Themen 5
R Schlüsselworte "Throw new exception" gibt nicht den String als Fehlermeldung aus Allgemeine Java-Themen 2
R Variablen String mit split-Funktion aufteilen Allgemeine Java-Themen 7
F Datei in String-Array einlesen Allgemeine Java-Themen 8
S Marker aus String ermitteln Allgemeine Java-Themen 5
T Objekt mit String und Int aus TxT Datei erstellen Allgemeine Java-Themen 23
M Bei String.format ein Komma statt einem Punkt ausgeben lassen Allgemeine Java-Themen 1
S MSSQL Exception & Connection String Allgemeine Java-Themen 19
B Bei Email: FW / AW... - Hilfe bei String suche Allgemeine Java-Themen 21
J String - Vergleiche Allgemeine Java-Themen 7
K Aus String zwei Jahreszahlen auslesen Allgemeine Java-Themen 18
Drachenbauer Wie kann eine vorgegebene Farbe über einen String erkannt werden? Allgemeine Java-Themen 11
G CSV in String Allgemeine Java-Themen 7
P String-Verschlüsselung - Frage zur Sicherheit Allgemeine Java-Themen 21
K Methodenaufruf mit String / String zu Objekt konvertieren Allgemeine Java-Themen 8
D Erste Schritte Fehler mit negativen und 0 Zahlen im String Allgemeine Java-Themen 6
Xge Replace x Zeichen aus String Allgemeine Java-Themen 2
coolian warum bekomme ich ein string index out of bounds exception Allgemeine Java-Themen 17
F In String 2 Buchstaben vertauschen Allgemeine Java-Themen 2
J Class Decompile als String (Procyon) Allgemeine Java-Themen 2
I Datentypen String in class sicher verwahren Allgemeine Java-Themen 17
J Falls der String ein "X" beinhaltet Allgemeine Java-Themen 2
T String mehrere Worte Allgemeine Java-Themen 2
D String Groß-/Kleinschreibung Allgemeine Java-Themen 2
D String und Klassenvariable Allgemeine Java-Themen 6
Aruetiise Funktion(y = mx+n) in String speichern und berechnen Allgemeine Java-Themen 9
C String in Objektnamen umwandeln Allgemeine Java-Themen 3
E Variablen Aus .txt ausgelesener string mit if() überprüfen? Allgemeine Java-Themen 2
L String-Schema-Aufspaltung Allgemeine Java-Themen 2
E String in Zahl umwandeln, ohne Befehl Integer.parseInt Allgemeine Java-Themen 3
L String splitten und multiplizeren Allgemeine Java-Themen 10
G String mit umbekannter länge splitten. Allgemeine Java-Themen 2
S Einzigartigen String in Datenbank finden und löschen Allgemeine Java-Themen 23
A Byte zu String Allgemeine Java-Themen 4
B Von String zu <Objekt> ||Speichern/Laden Allgemeine Java-Themen 17
T Komplexitätsoptimierung String vergleich Allgemeine Java-Themen 4
heinz ketchup String im JLabel ausgeben und erneuern Allgemeine Java-Themen 6
S Input/Output Beste Möglichkeit einen String in einen Datei zu Schreiben Allgemeine Java-Themen 2
V Eingegeben String Splitten und in Integer umwandeln Allgemeine Java-Themen 2
L Decrypt String Allgemeine Java-Themen 1
X Variablen AtmicLong größer als String ? Allgemeine Java-Themen 4
S String literal und Referenzvariablen Allgemeine Java-Themen 6
J Datentypen Absätze mit String im Word Dokument Allgemeine Java-Themen 3
D "Paste" String doppelt Allgemeine Java-Themen 14
E String Frage Allgemeine Java-Themen 9
T String aus While Schleife für ganze Klasse sichtbar machen Allgemeine Java-Themen 5
D JSON to String Allgemeine Java-Themen 31

Ähnliche Java Themen

Neue Themen


Oben