Methoden Umlaute in Java

claudisus · 22. Nov 2024

Java:

public static String removeNonLetters(String sentence) {
        String removeNonLetters = "";
        for (int i = 0; i < sentence.length(); i++) {
            char character = sentence.charAt(i);
            if ((character >= 'a' && character <= 'z' || character >= 'A' && character <= 'Z')) {
                removeNonLetters = removeNonLetters + character;
            }
        }
        return removeNonLetters.replaceAll("\s", "");
}

Guten Tag. Ich habe eine Frage bezüglich Umlauten in Java. Die folgende Methode ist dazu gedacht, alle chars, die keine Buchstaben sind, aus einem String zu entfernen. Das klappt auch soweit ganz gut, nur habe ich durch Testfälle nun festgestellt, dass die Umlaute "äöü" in java keine Buchstaben sondern Zeichen sind, wodurch diese natürlich ungewollter Weise auch aus dem String entfernt werden. wie kann ich eine Ausnahme in meinen Code implementieren, sodass die Umlaute nicht entfernt werden?

mihe7 · 22. Nov 2024

claudisus hat gesagt.:
dass die Umlaute "äöü" in java keine Buchstaben sondern Zeichen sind

Wie meinen?

Schau Dir mal die Methode Character.isLetter() an. Alternativ kannst Du selbstverständlich einfach prüfen, ob das Zeichen ein Umlaut ist (z. B. character == 'ö' bzw. character == '\u00f6', um im Quelltext keine Umlaute zu haben). Außerdem wäre auch ein regulärer Ausdruck möglich, dann verkürzt sich die Methode auf ein Minimum, der Rumpf der Methode besteht dann z. B. nur noch aus

Java:

return sentence.replaceAll("[^A-Za-zÄÖÜßäöü]", "");

DefconDev · 22. Nov 2024

Die ganzen Umlaute stehen doch in der Unicode Tabelle komplett woanders, deswegen funktioniert das nicht. Du betrachtest den Wertebereich innerhalb von a bis z und A bis Z. Und innerhalb dieser Bereiche existieren keine deutschen Umlaute.

Unicode/UTF-8-Zeichentabelle

Einfach mal schauen wo sich die befinden.

WhosWhat · 23. Nov 2024

mihe7 hat gesagt.:
return sentence.replaceAll("[^A-Za-zÄÖÜßäöü]", "");

Da fehlt noch das große Eszett

mihe7 · 24. Nov 2024

@WhosWhat Danke für den Hinweis.

WhosWhat · 24. Nov 2024

Sieht in etwa so aus:

-> ẞ ß

Finde alle Unicode Zeichen von Hieroglyphen bis zu Glyphen – Unicode Compart

U+1E9E ist der Unicode-Hexadezimal-Wert des Zeichens Lateinischer Großbuchstabe Scharf-S. Code U+1E9E, Kodierungen, HTML-Entitäten:ẞ,ẞ, UTF-8 (hex), UTF-16 (hex), UTF-32 (hex)

www.compart.com

Marinek · 24. Nov 2024

Ja. Das kommt sehr häufig vor. Sollte man entsprechend beachten.

WhosWhat · 24. Nov 2024

Marinek hat gesagt.:
Das kommt sehr häufig vor.

Ja, zum Beispiel in Überschriften

mihe7 · 24. Nov 2024

Wobei das ß eigentlich zu viel war, schließlich hat der OP nur nach Umlauten gefragt.

thecain · 24. Nov 2024

Unser lieblingsakademiker

KonradN · 24. Nov 2024

Wie immer: Man erkennt Tobias, fragt sich: Soll ich ihn direkt bannen? Und immer wieder denke ich mir: "Noch hatte er ja nicht seinen Moment - evtl. ist er ja jetzt erwachsen geworden". So langsam sollte ich es doch gelernt haben, dass dieses "An das Gute in Tobias glauben" schlichtweg falsch ist ...

mihe7 · 24. Nov 2024

Der Einwand von ~~@WhosTobias~~@WhosWhat war doch nicht ganz unberechtigt: In Versalien oder Kapitälchen gesetzter Text könnte durchaus das große Eszett (ẞ) enthalten. Mag jetzt für den OP weniger relevant sein und die Transferleistung kann man dann schon voraussetzen, das Zeichen in den regulären Ausdruck aufzunehmen, aber den Hinweis als solches finde ich nicht schlecht: das ist etwas, was man normalerweise nicht auf dem Schirm hat.

Interessant in diesem Zusammenhang:

https://de.wikipedia.org/wiki/Gro%C3%9Fes_%C3%9F hat gesagt.:
Am 29. Juni 2017 wurde das Eszett als Versal-Variante (ẞ) der Rechtschreibung hinzugefügt, sodass es heute offiziell verwendet werden darf,[6] wobei „SS“ der Regelfall blieb. Dieses Verhältnis wurde 2024 umgedreht: „ẞ“ ist nun der Regelfall, „SS“ die Ausnahme.[7]

Das heißt für mich:
a) dass wir es künftig öfter mit dem großen Eszett zu tun bekommen könnten
b) dass eigentlich die Regeln in Java angepasst werden müssten. Character.toUpperCase('ß') müsste z. B. das große Eszett liefern und bei regulären Ausdrücken müsste ein "(?i)ß" auch das große Eszett matchen. (Nachtrag: ~~hier muss ich mal die aktuelle Version testen~~ ist immer noch "falsch")

Auch wusste ich nicht, dass man in Windows das große Eszett seit Windows 8 mittels Shift + AltGr + ß eintippen kann.

mihe7 · 24. Nov 2024

Die Thematik ist ja noch bescheuerter als gedacht 🤣

https://community.snowflake.com/s/article/why-latin-small-sharp-s-upper-case-to-SS hat gesagt.:
From Unicode 5.1.0, there has been a change in the handling of the Latin character sharp S. The upper of LATIN SMALL LETTER SHARP S now corresponds to 'SS'. This is due to the usage of capital ß in German. German orthography uses the string "SS" as uppercase mapping for small sharp s. Thus, with the default Unicode casing operations, capital sharp s will lowercase to small sharp s, but not the reverse: small sharp s uppercases to "SS".

Das entspricht wohl dem Stand 2017. Jetzt ist es also (wieder) umgekehrt 🤣

Im aktuellen Unicode-Standard wird es auch noch so erklärt: https://www.unicode.org/versions/Unicode16.0.0/core-spec/chapter-5/#G36881

Hello World: don't mess with German bureaucrazy (sic!)

Nouser · 24. Nov 2024

mihe7 hat gesagt.:
Die Thematik ist ja noch bescheuerter als gedacht 🤣

Was 'ne ẞeiße

mihe7 · 24. Nov 2024

Nouser hat gesagt.:
Was 'ne ẞeiße

Aber wirklich. Da macht sich vermutlich kein Mensch Gedanken, was so eine kleine Änderung nach sich zieht.

Ich dachte zuerst auch: okay, das muss in Java angepasst werden... Dann: Moment, das ist doch ein allgemeines Thema, kann ja nicht sein, dass das einer so und der andere so macht. Okay, der Spaß ist in Unicode spezifiziert. Und jetzt geht's los: alles, was mit Unicode zu tun hat, muss entsprechend aktualisiert bzw. berücksichtigt werden. Und was hat das für Auswirkungen? Beispiel: Java an DB... lol.

Vermutlich wird das keine größere Folgen nach sich ziehen, aber ich möchte nicht wissen, in wie vielen Fällen das zumindest zu kleineren Problemen führt. Oder wenn ich an Statistiken denke, die vollautomatisch erzeugt werden. Ob das dann immer alles korrekt behandelt wird...

Marinek · 24. Nov 2024

mihe7 hat gesagt.:
Aber wirklich. Da macht sich vermutlich kein Mensch Gedanken, was so eine kleine Änderung nach sich zieht.

Doch klar

. Der IT Planungsrat hat eine entsprechende DIN vorbereitet welche Zeichen zwingend von Systemen der öffentlichen Verwaltung verarbeitet werden sollen. Das ist das große ß mit dabei.

Viele der Daten auf einem Personalausweis wurden in Großbuchstaben angegeben. Dabei auch das ß. Kommt in dem Bereich oft vor.

Aber: Hier in dem Thread nicht von Belang. Es gibt noch hundert andere Zeichen wie 🥸😏 oder ë oder ę , die man im europäischen Raum auch verarbeiten können muss.

Wie dem auch sei: Der User hat Umlaute auf „öäü“ eingeschränkt. Daher ist weder der Hinweis von dem Troll Tobi dahingehend notwendig noch berechtigt.

Nouser · 24. Nov 2024

Marinek hat gesagt.:
Daher ist weder der Hinweis von dem Troll Tobi dahingehend notwendig noch berechtigt.

Auf der anderen Seite finde ich es gut, mal wieder etwas sensibilisiert worden zu sein. Auch der kleine Exkurs von @mihe7 passte da sehr schön.

KonradN · 24. Nov 2024

mihe7 hat gesagt.:
Der Einwand von ~~@WhosTobias~~@WhosWhat war doch nicht ganz unberechtigt

Ja, aber das ist kein Grund für Entgleisungen. Wenn er da eine "akademische Diskussion" geführt hätte über das Thema, dann wäre es ja ok. Aber das ist halt einfach so nicht sinnvoll ...

Und dann über irgendwelche VPN Server einen neuen Account zu erstellen um noch ein Post zu machen ... Sorry, aber wenn man mich irgendwo nicht will, dann würde ich da nicht ständig neue Accounts erstellen ...

mihe7 · 24. Nov 2024

KonradN hat gesagt.:
Ja, aber das ist kein Grund für Entgleisungen.

Oh, die Entgleisungen habe ich leider verpasst 😃

KonradN hat gesagt.:
Sorry, aber wenn man mich irgendwo nicht will, dann würde ich da nicht ständig neue Accounts erstellen ...

Wohl wahr.

Marinek hat gesagt.:
Es gibt noch hundert andere Zeichen wie 🥸😏 oder ë oder ę , die man im europäischen Raum auch verarbeiten können muss.

Sicher, das ist aber auch nicht das Problem. Es geht ja um die Änderungen: heute machen wir alles ohne großes Eszett, das ersetzen wir durch SS. Dann führen wir optional ein großes Eszett ein. D. h. ein kleines Eszett wird nach wie vor zu einem SS, ein großes Eszett wird dafür zu einem kleinen Eszett. Und jetzt gehen wir her und ändern die Prioritäten: großes Eszett "Pflicht", SS optional. Dass irgendwer mit den Daten dann noch vernünftig arbeiten können soll: 🤷‍♂️

	Titel	Forum	Antworten	Datum
C	Java stellt unter Windows keine Umlaute dar	Java Basics - Anfänger-Themen	9	4. Sep 2015
M	Umlaute in Java Applets?	Java Basics - Anfänger-Themen	3	13. Jun 2008
E	Umlaute und Sonderzeichen werden nach der Build Project nicht richtig angezeigt	Java Basics - Anfänger-Themen	2	25. Jan 2022
L	Collator Umlaute	Java Basics - Anfänger-Themen	5	5. Sep 2019
O	URL, UTF8, Umlaute	Java Basics - Anfänger-Themen	15	25. Feb 2019
S	Base64 - Wie beziehe ich die Umlaute in die Speicherplatzrechnung mit ein?	Java Basics - Anfänger-Themen	52	11. Dez 2017
F	Umlaute beim versenden von SMS	Java Basics - Anfänger-Themen	10	2. Okt 2017
	Input/Output Umlaute in generierter HTML-Datei	Java Basics - Anfänger-Themen	7	20. Mrz 2017
W	JTextField-Objekt liest Umlaute mit falschen Zeichen ein	Java Basics - Anfänger-Themen	5	1. Mai 2015
A	Text mit "Scanner" eingeben und Umlaute ersetzen	Java Basics - Anfänger-Themen	7	5. Dez 2014
W	HTML Code, Umlaute werden nicht richtig dargestellt	Java Basics - Anfänger-Themen	7	26. Aug 2014
F	Scanner + Stringbuilder geben leeren String aus wenn Umlaute enthalten sind	Java Basics - Anfänger-Themen	29	1. Dez 2013
S	Codierung der Umlaute in Mails	Java Basics - Anfänger-Themen	2	28. Nov 2013
M	Fileoutputstream: Linux Dateinamen mit Umlaute	Java Basics - Anfänger-Themen	4	23. Nov 2013
	Umlaute ausgeben	Java Basics - Anfänger-Themen	7	9. Jan 2013
V	Umlaute in mysql, antscript, powershell utf-8	Java Basics - Anfänger-Themen	7	7. Jan 2013
V	Umlaute beim Parsen einer HTML Seite	Java Basics - Anfänger-Themen	4	6. Jan 2013
	Keine Umlaute im Dos Fenster	Java Basics - Anfänger-Themen	12	2. Okt 2012
S	Umlaute aus Dateisystem entfernen	Java Basics - Anfänger-Themen	5	22. Mrz 2012
B	InetAddress und umlaute	Java Basics - Anfänger-Themen	2	31. Jan 2012
S	Umlaute in Swing-GUI	Java Basics - Anfänger-Themen	8	12. Dez 2011
D	javadoc: wie werden Umlaute richtig dargestellt?	Java Basics - Anfänger-Themen	3	15. Okt 2011
B	Input/Output Kodierte Umlaute aus Datei umwandeln?	Java Basics - Anfänger-Themen	2	13. Okt 2011
R	Umlaute Mac -> Windows	Java Basics - Anfänger-Themen	2	24. Aug 2011
0	Umlaute	Java Basics - Anfänger-Themen	4	26. Jul 2011
R	UTF-8 Webseite Umlaute lesen.	Java Basics - Anfänger-Themen	2	20. Jun 2011
F	SQL Server aus Umlaute werden Fragezeichen	Java Basics - Anfänger-Themen	4	17. Nov 2010
P	Umlaute in Datei ändern	Java Basics - Anfänger-Themen	4	9. Mai 2010
R	Umlaute mit Switch-Case tauschen	Java Basics - Anfänger-Themen	26	11. Apr 2009
F	Umlaute eines Strings entfernen (Verwendung von this?)	Java Basics - Anfänger-Themen	2	1. Feb 2009
S	Eingabeaufforderung stellt Umlaute nicht dar	Java Basics - Anfänger-Themen	10	24. Jan 2009
A	Umlaute darstellen	Java Basics - Anfänger-Themen	4	8. Dez 2008
O	Umlaute bei der Erfassung	Java Basics - Anfänger-Themen	12	8. Feb 2008
P	Umlaute und Byte	Java Basics - Anfänger-Themen	2	10. Okt 2007
J	Umlaute	Java Basics - Anfänger-Themen	3	31. Jan 2007
R	Umlaute in einer .properties-Datei	Java Basics - Anfänger-Themen	1	18. Okt 2006
S	Umlaute und Sonderzeichen erkennen	Java Basics - Anfänger-Themen	12	2. Nov 2005
C	umlaute mit DataOutputStream schreiben	Java Basics - Anfänger-Themen	3	14. Feb 2005
N	Umlaute ersetzen	Java Basics - Anfänger-Themen	1	26. Dez 2003
J	Probleme mit drucken aus Java	Java Basics - Anfänger-Themen	3	22. Mrz 2025
	Java chart library suggestion for web application?	Java Basics - Anfänger-Themen	2	18. Mrz 2025
D	wie kann ich gcc aus einer .java datei heraus aufrufen?	Java Basics - Anfänger-Themen	2	24. Dez 2024
S	Text Formatierung in Java	Java Basics - Anfänger-Themen	2	15. Dez 2024
B	Erste Schritte yaml parsen in Java	Java Basics - Anfänger-Themen	19	29. Nov 2024
W	Java-PRogramm liest als EXE-File Nicht USB, jedoch aus NetBeans	Java Basics - Anfänger-Themen	45	12. Nov 2024
W	Methoden java map ersatz für c++map	Java Basics - Anfänger-Themen	3	30. Okt 2024
M	Erste Schritte Java Primzahltester	Java Basics - Anfänger-Themen	4	28. Okt 2024
A	csv Reader für Java?	Java Basics - Anfänger-Themen	27	16. Okt 2024
K	Java - Enums	Java Basics - Anfänger-Themen	30	16. Okt 2024
	Java Unterstützung für exel dateien installieren.	Java Basics - Anfänger-Themen	2	13. Aug 2024
	java.lang.NoClassDefFoundError: org/json/JSONException	Java Basics - Anfänger-Themen	2	31. Jul 2024
	Mit Button andere java öffnen	Java Basics - Anfänger-Themen	4	19. Jul 2024
F	Java Object to Hashmap ?	Java Basics - Anfänger-Themen	6	26. Jun 2024
I	Backend in Java und Ansicht von Dateien in statische HTML Seiten?	Java Basics - Anfänger-Themen	15	11. Jun 2024
R	Input/Output Verwendung des Euro-Zeichens in Java	Java Basics - Anfänger-Themen	7	22. Mai 2024
I	Push Nachrichten von JAVA EE App an Mobile App	Java Basics - Anfänger-Themen	3	5. Mai 2024
H	.java Dateien in Eclipse einbinden und ausführen	Java Basics - Anfänger-Themen	1	16. Apr 2024
	Schlüsselworte Was meint man mit "einen Typ" in Java erstellen?	Java Basics - Anfänger-Themen	2	29. Mrz 2024
O	Java Kara geschweifte Klammern	Java Basics - Anfänger-Themen	2	25. Feb 2024
G	Mausrad logitech kann links und rechts klick wie in java abragen.	Java Basics - Anfänger-Themen	15	13. Feb 2024
	Java Klssenproblem	Java Basics - Anfänger-Themen	4	5. Feb 2024
R	Umgebungsvariable java -cp gibt immer Java-Hilfe...	Java Basics - Anfänger-Themen	3	20. Jan 2024
	Csv Datei in Java einlesen	Java Basics - Anfänger-Themen	18	15. Jan 2024
F	TableModelListener: java.lang.ArrayIndexOutOfBoundsException: 132	Java Basics - Anfänger-Themen	3	10. Jan 2024
G	Java 8 - Support-Ende	Java Basics - Anfänger-Themen	7	9. Jan 2024
T	Java Weihnachtsbaum + Rahmen	Java Basics - Anfänger-Themen	1	2. Jan 2024
N	Will mit Java anfangen	Java Basics - Anfänger-Themen	13	28. Dez 2023
Ü	Java Array - Buchstaben als Zahlen ausgeben	Java Basics - Anfänger-Themen	22	1. Dez 2023
M	Java Iterator Verständnisfrage	Java Basics - Anfänger-Themen	6	20. Nov 2023
M	Java Mail Programm	Java Basics - Anfänger-Themen	4	6. Nov 2023
	Java 391 für Windows	Java Basics - Anfänger-Themen	37	30. Okt 2023
G	Java long- in int-Variable umwandeln	Java Basics - Anfänger-Themen	6	27. Okt 2023
	Java im Studium	Java Basics - Anfänger-Themen	7	23. Okt 2023
E	Java Programm zur anzeige, ob Winter- oder Sommerzeit herrscht	Java Basics - Anfänger-Themen	62	20. Okt 2023
I	QR code in Java selber generieren	Java Basics - Anfänger-Themen	5	9. Okt 2023
V	Java-Ausnahmebehandlung: Behandlung geprüfter Ausnahmen	Java Basics - Anfänger-Themen	1	3. Okt 2023
	Java Streams	Java Basics - Anfänger-Themen	10	29. Sep 2023
A	Überwältigt von der komplexen Java Welt	Java Basics - Anfänger-Themen	29	20. Sep 2023
O	Mehrfachvererbung auf Spezifikations- und Implementierungsebene in Java. Interfaces	Java Basics - Anfänger-Themen	19	10. Sep 2023
	Homogene Realisierung von Generics in Java ?	Java Basics - Anfänger-Themen	19	17. Aug 2023
P	Meldung aus Java-Klasse in Thread an aufrufende Klasse	Java Basics - Anfänger-Themen	1	15. Aug 2023
R	mit Java API arbeiten	Java Basics - Anfänger-Themen	9	15. Aug 2023
P	JDK installieren Probleme bei der Java-Installation	Java Basics - Anfänger-Themen	8	9. Aug 2023
S	Java: Wie sortiere ich eine ArrayList benutzerdefinierter Objekte nach einem bestimmten Attribut?	Java Basics - Anfänger-Themen	2	31. Jul 2023
	JNLP File mit Java öffnen	Java Basics - Anfänger-Themen	2	29. Jul 2023
S	Video Editierung mit Java.._	Java Basics - Anfänger-Themen	2	18. Jul 2023
F	Einstelungen in Java - CursorBlinkRate	Java Basics - Anfänger-Themen	10	10. Jul 2023
A	PHP $_POST["name"] in Java	Java Basics - Anfänger-Themen	3	10. Jul 2023
	Is there a oneliner to create a SortedSet filled with one or multiple elements in Java?	Java Basics - Anfänger-Themen	9	22. Jun 2023
	Weißes Bild in Java erstellen	Java Basics - Anfänger-Themen	3	19. Jun 2023
	Can someone please tell me how to use a debugger in BlueJ(a Java environment)	Java Basics - Anfänger-Themen	1	15. Jun 2023
M	Java assoziationen (UML)	Java Basics - Anfänger-Themen	8	14. Jun 2023
H	Excel-Tabellen mit Java erstellen	Java Basics - Anfänger-Themen	4	25. Mai 2023
	Java ArrayListe von einer Klasse sortieren	Java Basics - Anfänger-Themen	2	15. Mai 2023
P	Wie kann ich in meinem Java Programm etwas dauerhaft speichern?	Java Basics - Anfänger-Themen	5	7. Mai 2023
H	Nutzt Eclipse alle CPU-Threads beim Ausführen von Java-Programmen?	Java Basics - Anfänger-Themen	4	5. Mai 2023
	Java einstieg, leichte sache 0 verstanden	Java Basics - Anfänger-Themen	7	27. Apr 2023
A	java.sql.SQLException: Data type mismatch.	Java Basics - Anfänger-Themen	1	27. Apr 2023
H	Java-Programm zur Ausgabe von Zuständen	Java Basics - Anfänger-Themen	80	26. Apr 2023
N	Java Spiel Figur auf dem Hintergrundbild bewegen.	Java Basics - Anfänger-Themen	11	23. Apr 2023

Methoden Umlaute in Java

Neues Mitglied

Top Contributor

Bekanntes Mitglied

Mitglied

Top Contributor

Mitglied

Bekanntes Mitglied

Mitglied

Top Contributor

Top Contributor

Super-Moderator

Top Contributor

Top Contributor

Mitglied

Top Contributor

Bekanntes Mitglied

Mitglied

Super-Moderator

Top Contributor

Ähnliche Java Themen