Regex, um Sätze zu erkennen

bin4ry

Mitglied
Hi,

ich möchte mittels der RegEx-Klasse einen Text so parsen, dass die einzelnen Sätze erkannt werden. Ich will es nicht komplex machen und nur auf Satzendezeichen '.', '?' und '!' matchen. Ein RegEx dazu wäre

\\w*[.?!](?=\\s)


Wenn ich das nun aber implementiere, matched er nie. Was mache ich falsch?

Java:
Pattern pat = Pattern.compile("\\w*[.?!](?=\\s)");
		//Pattern pat = Pattern.compile("^([0-9a-zA-Z]+([_.-]?[0-9a-zA-Z]+)*@[0-9a-zA-Z]+[0-9,a-z,A-Z,.,-]*(.){1}[a-zA-Z]{2,4})+$");
			
		Matcher patmatch = pat.matcher(fileContent);
		if(patmatch.matches())
		{
			System.out.println("it matches");
		}else{
			System.out.println("No matches");
		}
	}

Der Inhalt von fileContent ist:

"Dies ist ein Test. Dies ist ein weiterer Test! Dies ist noch einer."


Danke
 
Zuletzt bearbeitet:

Wildcard

Top Contributor
Die matches Methode liefert nur true wenn der gesamte Eingabestring matched. Schau dir mal die anderen Methoden wie zB matcher.find an.
 

palador

Mitglied
Ich weis ja nicht, wie gut deine Satzerkennung sein soll. Beachte aber, das gerade der Punkt ('.') oft für andere Sachen als das Satzende verwendet wird, wie z.B. nach Abkürzungen oder nach Ordinalzahlen.
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
M Regex-Regel um fehlende Schlusszeichen zu finden Softwareentwicklung 1
H Regex Frage Softwareentwicklung 2
C Regex Problem Softwareentwicklung 1
H [Java]Regex Hilfe Softwareentwicklung 3
TheJavaKid RegEx Problem Softwareentwicklung 2
P Nur ganze Worte ersetzen mit RegEx Softwareentwicklung 2
C Regex-Problem Softwareentwicklung 24
G RegEx Version number Softwareentwicklung 8
M Regex Ausnahmen/Bedingungen Softwareentwicklung 5
H [RegEx] Anführungszeichen finden Softwareentwicklung 2
B Regex-Problem mit replace außerhalb des matching bereichs liegender Zeichenketten Softwareentwicklung 2
A Regex mit Negation Softwareentwicklung 2
ruutaiokwu regex, der mit nur html-comments, nicht aber javascript entfernt Softwareentwicklung 16
V RegEx um zu escapen? Softwareentwicklung 2
TiME-SPLiNTER Banales regEx-Problem Softwareentwicklung 2
A Verschachteln von REGEX Softwareentwicklung 4
D Regex zur auswertung von SQL Statements Softwareentwicklung 3
S Regex Frage Softwareentwicklung 4
S sonderzeichen mit regex abfragen Softwareentwicklung 2
N Wie testet ihr regex auf korrektheit? Softwareentwicklung 8
m@nu Problem mit einer RegEx Softwareentwicklung 4
S [RegEx] Dateigerecht geschriebene Namen parsen Softwareentwicklung 2
H MVC / MVP erkennen Softwareentwicklung 2

Ähnliche Java Themen

Neue Themen


Oben