RegEx Stringliteral finden - Jflex

werdas34

Bekanntes Mitglied
Hallo,
in meiner Compiler Vorlesung wollen wir als Übung einen eigenen Compiler schreiben.

In der ersten Phase soll aus dem Zeichenstrom die ganzen Keywords, Comments, Identifier, Datatypes und so weiter erkennen durch RegEx.
Ich kann alles erkennen außer Stringliterale.
String test = "Test"; //-> Output from RegEx: "Test"
Jflex ist ein Scanner, womit man die RegEx einträgt und spukt dann eine entsprechende Java Datei. Jflex basiert auf Java.

Wenn man jetzt Java-Syntax verwende muss man aufpassen, da sonst die Java-Datei nicht compiliert werden kann.
Der RegEx && muss in JFlex "&&" heißen und nicht &&, wie es bei anderen RegEx der Fall ist. Sonst spukt die Java datei nen Fehler.

Bei Stringliteralen ist das jetzt bisschen schwierig. Entweder "Test" dann lautet der eigentliche RegEx Test. Mache ich ""Test"" funktioniert es auch nicht.
Der Stringliteral darf leer sein, Sonderzeichen und paar Escape Zeichen (\n, \t, \’, \", \\) enthalten.

Kann mir jemand einen Tipp sagen wie ich das hinkriege? Oder jemand schonmal mit Jflex gearbeitet?

Hier mal die gekürzte Variante vom Code.
Code:
%%

%class Scanner
%standalone
%line
%column
//%implements sym

ALPHA                 = [A-Za-z]
ZERO                 = 0
DIGIT                 = [1-9]
ESCAPE                = (\n|\t|\’|\"|\\)
SPECIAL_CHARACTER     = [&!#]

WHITESPACE             = ([ \t\n] | " ")

%{   
    static int counter = 1;
    void prettyPrint(int line, int column, String regex){
        System.out.println(counter + ":\t Zeile: " + line + "\t Spalte: " + column + "\t gefundener Ausdruck: " + regex);
        counter++;
    }
%}


%%
    
   

/*Stringliteral*/
    "({ZERO} | {DIGIT} | {ALPHA} | {ESCAPE} | {SPECIAL_CHARACTER}  | {WHITESPACE})*"            {prettyPrint(yyline, yycolumn, yytext() + " - Stringliteral");}

/*Operator*/
    "!"                                                                        {prettyPrint(yyline, yycolumn, yytext() + " - Operator");}
    "&&"                                                                    {prettyPrint(yyline, yycolumn, yytext() + " - Operator");}
    "||"                                                                        {prettyPrint(yyline, yycolumn, yytext() + " - Operator");}

mfg werdas34
 

werdas34

Bekanntes Mitglied
Die Antwort ist für die meisten Fälle ausreichend. Da wir aber extra die Anweisung erhalten haben folgende \n \t \’ \” \\ Escape Symbole zu erlauben, hat man das Problem wenn man ^\". Und ich weiß es jetzt nicht aber es gibt vermutlich mehr als nur diese Escape Symbole. Diese würden alle funktionieren.
Ich stelle mir das ca. so vor(da weiter unten in der Aufgabe steht es sollen nur Zeichen erlaubt werden, die in der Aufgabe erwähnt wurden:


Code:
ALPHA                 = [A-Za-z]
DIGIT                = [0-9]
WHITESPACE            = \s //[\ \t\n]
ESCAPE                 = [\n\t\’\"\\] 
SPECIAL_CHARACTER     = [&!#] // wird später noch aufgestockt
\"({ALPHA} | {DIGIT} | {ESCAPE} | {SPECIAL_CHARACTER} | {WHITESPACE})*\"

Die Eingabe die der RegEx bestehen muss ist folgende:
""
"&!#"
"use \n to denote a newline character"
"include a quote like this \" and a backslash like this \\"
Momentan sieht er alles als einen String an. Wie mache ich das? Ist das mit der Bedingung überhaupt möglich wenn \n zugelassen wird?
 

werdas34

Bekanntes Mitglied
Und wie in aller Welt soll das mit mehrzeiligen Kommentaren funktionieren?
/* fgarfd */
/*
sdfg
*/
Code:
^\/\*(.|\s)*?\*\/$
wird auf der Seite (https://regex101.com/r/RkheRs/1) als richtig gemeldet, sobald ich ihn ausführe sieht er nach dem ersten /* alles als einen String an...
 

Oneixee5

Top Contributor
Das ist doch nicht schwer, deshalb habe ich darauf verzichtet. Aus \n wir \\n, aus \\ wird \\\\ usw.
Für mehrzeilige Text gibt es Regex-Flags, z.B.: s
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
H Frage regex greater than less than Allgemeine Java-Themen 7
N Regex schlägt nicht an Allgemeine Java-Themen 10
W Variable Initialisierung mit dem Ergebnis einer Regex Allgemeine Java-Themen 1
T regex case insensitive trimmed Allgemeine Java-Themen 6
S Zeichen | in regex Allgemeine Java-Themen 8
X Regex mit mehreren Bedingungen machen Allgemeine Java-Themen 5
N Hilfe bei RegEx benötigt Allgemeine Java-Themen 3
C Java17 und Regex Allgemeine Java-Themen 13
OnDemand RegEx /compilebekomme nicht die erwarteten Werte Allgemeine Java-Themen 9
N Gierigen Regex in nicht-gierigen umwandeln Allgemeine Java-Themen 4
N E-Mail Validator (ohne Regex!) Allgemeine Java-Themen 7
OnDemand Regex von bis Allgemeine Java-Themen 6
W Versionsnummer auslesen - Regex ist zickig Allgemeine Java-Themen 2
L RegEx für Teile einer Berechnung Allgemeine Java-Themen 14
G Regex Allgemeine Java-Themen 2
L regex ganzer string? Allgemeine Java-Themen 2
MiMa Geldbetrag mit regex ermitteln. Allgemeine Java-Themen 14
D Regex Probleme Allgemeine Java-Themen 2
Kirby.exe Regex charakter ignorieren Allgemeine Java-Themen 12
S Java SAT (Haltbarkeitsproblem) mit Regex Allgemeine Java-Themen 6
S [Regex] Nur diese Zeichen beachten Allgemeine Java-Themen 1
M Bitte Hilfe mit REGEX (Negieren) Allgemeine Java-Themen 4
J Compilerfehler bis in java.util.regex.Pattern... Allgemeine Java-Themen 2
C PDFBox: Nach RegEx ganze Zeile Allgemeine Java-Themen 4
S Regex mit UND-Verknüpfung Allgemeine Java-Themen 1
P RegEx für Zeiten Allgemeine Java-Themen 7
D Regex: Komplettes Wort bekommen Allgemeine Java-Themen 3
Neumi5694 Operatoren regEx für das Erstellen eines Strings verwenden Allgemeine Java-Themen 3
P RegEx Allgemeine Java-Themen 3
W String Parsen und auf eigenes Muster anwenden (kein Regex) Allgemeine Java-Themen 11
Y regex | n-faches Vorkommen oder gar keins Allgemeine Java-Themen 6
turmaline Regex gegen Regex prüfen Allgemeine Java-Themen 4
HarleyDavidson Regex - Optimierung Allgemeine Java-Themen 4
M Regex für Zahleneingabe in JavaFX Textfield Allgemeine Java-Themen 18
T Best Practice Wortregeln RegEx Allgemeine Java-Themen 11
A ALTER TABLE mit Hilfe von RegEx zerlegen, splitten Allgemeine Java-Themen 5
H Interpreter-Fehler Regex kompiliert nicht Allgemeine Java-Themen 5
M RegEx alle Matches ausgeben Allgemeine Java-Themen 5
Iron Monkey Mit Regex nach Beträge suchen Allgemeine Java-Themen 4
T REGEX Erklaerung Allgemeine Java-Themen 14
T Nur innerhalb des regex-Match ersetzen Allgemeine Java-Themen 9
H Pic Download / Regex Problem Allgemeine Java-Themen 7
F Frage zu Regex möglich Allgemeine Java-Themen 4
M Regex... mal wieder Allgemeine Java-Themen 3
H RegEx - Ersetze alles bis Leerzeichen Allgemeine Java-Themen 5
S regex verbrät CPU Allgemeine Java-Themen 6
V Regex Bereichs Filter Allgemeine Java-Themen 4
127.0.0.1 RegEx _ und 0-9 Allgemeine Java-Themen 45
S Entfernen von allen Nicht-Buchstaben chars aus einem String ohne Regex..? Allgemeine Java-Themen 10
P Java String Regex Allgemeine Java-Themen 2
AyKay Regex XPath Allgemeine Java-Themen 4
C Regex (Case insensitive und Umlaute) Allgemeine Java-Themen 4
D Regex Raute erkennen Allgemeine Java-Themen 2
nrg Zweistelligen Zahlenbereich mit RegEx Allgemeine Java-Themen 8
GilbertGrape Regex-Problem Allgemeine Java-Themen 2
W Denkblockade RegEx Allgemeine Java-Themen 2
S eigene regEx schreiben Allgemeine Java-Themen 4
C Regex expandieren Allgemeine Java-Themen 6
C Regex Überschniedung von Ausdrücken Allgemeine Java-Themen 16
reibi RegEX - Teilstring Allgemeine Java-Themen 6
R Java-RegEx terminiert nicht Allgemeine Java-Themen 3
M Regex: Ich stehe auf dem Schlauch Allgemeine Java-Themen 2
V Kleines Regex-Problem Allgemeine Java-Themen 3
B Regex "Problem" Allgemeine Java-Themen 4
B RegEx: (Um-)formulieren eines Pattern zur Identifizierung komplexer URLs Allgemeine Java-Themen 7
P RegEx mit HTML Parser für Java möglich? Allgemeine Java-Themen 10
J Regex: Fertige URLS aus Javascript Allgemeine Java-Themen 3
N Java regex Allgemeine Java-Themen 5
K Regex JSON Allgemeine Java-Themen 3
J RegEx Ausdruck Allgemeine Java-Themen 2
J Regex: URLS aus CSS Allgemeine Java-Themen 2
G RegEx- Ausdruck Allgemeine Java-Themen 4
G RegEx kein Unterstrich Allgemeine Java-Themen 2
A Text via RegEx durchsuchen und teile ersetzten Allgemeine Java-Themen 5
C Regex: Zahl ohne führende Null Allgemeine Java-Themen 13
W RegEx Zeile parsen Medium Allgemeine Java-Themen 8
X Java String Regex - Sonderzeichen Filtern Allgemeine Java-Themen 5
S Dateiname mit Regex parsen Allgemeine Java-Themen 3
Loyd Noch ne Regex-Frage: Verschachtelte Ausdrücke Allgemeine Java-Themen 4
R Java Regex Frage Allgemeine Java-Themen 17
Daniel_L RegEx-Frage: Ersetzen in UBB ausschließen Allgemeine Java-Themen 2
M Große Datei mit Regex durchsuchen Allgemeine Java-Themen 4
S regex für einen Link Allgemeine Java-Themen 3
E Regex alles nach ? löschen Allgemeine Java-Themen 4
M RegEx-Frage Allgemeine Java-Themen 2
R Regex Tokenizer Allgemeine Java-Themen 11
E Regex HTML Tag und Inhalt löschen Allgemeine Java-Themen 4
H RegEX und eMail Allgemeine Java-Themen 4
L-ectron-X Regex zum Entfernen von mehrzeiligen Kommentaren Allgemeine Java-Themen 2
martin82 Regex - JTable - Filter Allgemeine Java-Themen 10
nrg Kleine Hilfe mit RegEx Allgemeine Java-Themen 2
B Regex-Fehler nach lib-Update Allgemeine Java-Themen 2
K Contrains oder Regex Allgemeine Java-Themen 3
J replaceAll , "[", "]" & regex Allgemeine Java-Themen 12
P RegEx und $-Zeichen als Literal Allgemeine Java-Themen 5
P RegEx - Worte ausschließen Allgemeine Java-Themen 8
S Regex - was isst denn {javaLetter} und {javaDigit}? Allgemeine Java-Themen 2
D Wie werden Regex-Gruppen kompiliert? Allgemeine Java-Themen 2
Stillmatic RegEx Matches ausgeben Allgemeine Java-Themen 10
A Regex gesucht Allgemeine Java-Themen 9

Ähnliche Java Themen

Neue Themen


Oben