Hi bin ganz neu an Board und hab sogar schon eine Frage bei der ihr mir vll helfen könntet.
Da ich hoffe das dieser Beitrag irgendwann mal jemand anderem helfen wird, gebe ich mir extra viel Mühe. ;-)
Ich möchte Sätze aus Text extrahieren.
Meine Adhoc Lösung war also
Ok, was fällt auf ? Fälle wie "The Ex-President Georg W. Bush is a man." enden so:
Ok, also brauche ich eine Regel die keinen Split bei Einzelbuchstaben macht.
Hab ein Paar Tutorials gemacht und herrausgefunden, dass
Also hab ich:
Funktioniert aber nicht
Das Nächste Problem wäre zb "On 29. January the boy was Born" , "etc." und "My Prof. ask me to do some FooFooFoo"
Hab wirklich recht wenig Ahnung von RegExpr und hoffe deswegen das ihr mir helfen könnt.
Vielen Dank schonmal.
Da ich hoffe das dieser Beitrag irgendwann mal jemand anderem helfen wird, gebe ich mir extra viel Mühe. ;-)
Ich möchte Sätze aus Text extrahieren.
Meine Adhoc Lösung war also
Java:
text.split("[\\.\\!\\?]");
Ok, was fällt auf ? Fälle wie "The Ex-President Georg W. Bush is a man." enden so:
Java:
[The Ex-President Georg W]
[Bush is a man.]
Ok, also brauche ich eine Regel die keinen Split bei Einzelbuchstaben macht.
Hab ein Paar Tutorials gemacht und herrausgefunden, dass
Java:
^ = Negator
[A-Z] = Alle möglichen Großbuchstaben von A-Z.
{1} = der Länge 1
Also hab ich:
Java:
text.split("^([A-Z]{1}[.])|[\\.\\!\\?]");
Funktioniert aber nicht
Das Nächste Problem wäre zb "On 29. January the boy was Born" , "etc." und "My Prof. ask me to do some FooFooFoo"
Hab wirklich recht wenig Ahnung von RegExpr und hoffe deswegen das ihr mir helfen könnt.
Vielen Dank schonmal.
Zuletzt bearbeitet: