String.substring und UTF-16-Konformität [solved]

wolfgke · 17. Aug 2008

Hallo,
bekanntlich sind in Java Strings ja UTF-16 codiert.

Laut http://de.wikipedia.org/wiki/UTF-16 werden die Zeichen U+10000 bis U+10FFFF durch 2 UTF-16-Zeichen codiert. Was passiert nun, wenn ich auf einem String, welcher aus genau einem solchen Zeichen besteht String.substring(0,1) ausführe: beachtet Java korrekt, dass trotzdem 2 UTF-16-Wörter zur Codierung erforderlich sind oder wird Java (inkorrekterweise) nur den ersten Character verwenden und damit einen inkorrekten String erzeugen?

Grüße
wolfgke

SlaterB · 17. Aug 2008

vielleicht steht es hier:
http://itblog.eckenfels.net/archives/17-Java-und-Unicode.html

wolfgke · 17. Aug 2008

@SlaterB

In dem Text stehen eine Menge interessanter Dinge. Leider wird in den Codebeispielen dort dem von mir erwähnten Problem aus dem Weg gegangen.

didjitalist · 18. Aug 2008

String#substring zerlegt einen String _korrekt_ auf Basis des zugrundeliegenden char arrays. Diese supplementary characters werden dabei also als zwei Zeichen behandelt. Das zwingend notwendig, damit der Vertrag "x.substring( 0, n ).length == n" eingehalten werden kann.
Wenn du diese Unicodezeichen gesondert behandeln willst, bietet dir die String Klasse Methoden an, die mit codePoints arbeiten.

Murray · 18. Aug 2008

wolfgke hat gesagt.:
bekanntlich sind in Java Strings ja UTF-16 codiert.

Das würde ich so nicht sagen - Strings sind in Java erstmals Unicode, und UTF-16 ist ja - wie z.B. UTF-8 oder ISO-8859-1 - ein Encoding, also eine Abbildung der Unicode-Zeichen in eine andere Darstellung. Und solange Du bei der Unicode-Repräsentation bleibst und nur mit String, Character und char arbeitest, ohne dazwischen mal per String#getBytes oder "char-auf-int-Cast" die Unicode-Welt zu verlassen, wird kein Encoding verwendet.

wolfgke · 23. Aug 2008

Danke an alle. Jetzt wurde die Frage zufriedenstellend beantwortet.

	Titel	Forum	Antworten	Datum
Z	Frage zu String & Substring	Allgemeine Java-Themen	9	26. Feb 2008
C	EML Email Text in String wandeln	Allgemeine Java-Themen	9	Donnerstag um 10:40
	Java String in Hashmap als Key NULL	Allgemeine Java-Themen	27	8. Mrz 2023
	Datentypen Berechneten String-Wert in Double umwandeln um weiter zu rechnen	Allgemeine Java-Themen	7	7. Dez 2022
M	String	Allgemeine Java-Themen	10	25. Nov 2022
M	Suche nach String mit unbekannten characters	Allgemeine Java-Themen	53	20. Nov 2022
	String kann nicht zu Pfad konvertiert werden	Allgemeine Java-Themen	16	5. Nov 2022
	Einzelne Zeile aus einer txt Datei in einem String speichern	Allgemeine Java-Themen	12	30. Mai 2022
E	Objekte in einen String packen und wieder laden	Allgemeine Java-Themen	5	29. Jan 2022
M	Map<String,String>funktioniert nicht richtig	Allgemeine Java-Themen	4	26. Jan 2022
O	String in Long Hexerdezimal umwandel	Allgemeine Java-Themen	14	26. Nov 2021
N	String vergleichen.	Allgemeine Java-Themen	27	18. Nov 2021
P	String.replace() funktioniert nicht?	Allgemeine Java-Themen	3	18. Okt 2021
	Arbeitet String.split falsch?	Allgemeine Java-Themen	4	16. Okt 2021
M	Switches ohne String	Allgemeine Java-Themen	18	30. Aug 2021
	String Iteration	Allgemeine Java-Themen	5	25. Jul 2021
S	Shuffle String aus if-clause	Allgemeine Java-Themen	11	4. Jul 2021
	Variablen Ist String = "" + int inordnung?	Allgemeine Java-Themen	6	30. Mai 2021
M	Map <Long, String> zu Map<String, Long>	Allgemeine Java-Themen	9	12. Mai 2021
S	String Encoding Verständnisproblem	Allgemeine Java-Themen	22	7. Mai 2021
N	Prüfen, ob ein String 2x das selbe Zeichen hat	Allgemeine Java-Themen	10	30. Apr 2021
	Bug Fixen von String-spliten	Allgemeine Java-Themen	8	10. Mrz 2021
	String List nach Zahlen und Worten sortieren	Allgemeine Java-Themen	9	24. Jan 2021
	Alle mehrfach vorkommenden Buchstaben rekursiv aus einem String entfernen.	Allgemeine Java-Themen	6	13. Jan 2021
	String - Aufteilung und Nutzung einzelner Chars	Allgemeine Java-Themen	7	9. Jan 2021
O	Formatierte String ausgabe bei vier Variablen in einer Zeile	Allgemeine Java-Themen	1	15. Dez 2020
S	String umbenennen: wie?	Allgemeine Java-Themen	4	11. Nov 2020
	String Format Fehler	Allgemeine Java-Themen	2	8. Nov 2020
S	ISO 8601 -> getter / setter String	Allgemeine Java-Themen	3	30. Okt 2020
L	String zu repräsentativen Wert	Allgemeine Java-Themen	0	13. Aug 2020
H	Array mit dem Datentype String[] initializieren	Allgemeine Java-Themen	7	23. Jul 2020
L	ArrayList mit String Arrays in ein Array umwandeln	Allgemeine Java-Themen	1	23. Jul 2020
L	regex ganzer string?	Allgemeine Java-Themen	2	19. Jul 2020
L	Ist ein string ein erlaubter variabel name?	Allgemeine Java-Themen	2	18. Jul 2020
Z	JNA Cpp-DLL String Verwendung	Allgemeine Java-Themen	2	8. Jul 2020
A	String auf Zahlen überprüfen	Allgemeine Java-Themen	5	3. Jun 2020
N	String Array Eingabe	Allgemeine Java-Themen	6	22. Mai 2020
	Datum von String zu LocalDateTime	Allgemeine Java-Themen	8	21. Mai 2020
W	String -> byte[] -> String - Sieht jemand was ich nicht sehe?	Allgemeine Java-Themen	10	17. Mai 2020
R	char aus String entfernen	Allgemeine Java-Themen	10	29. Apr 2020
	Mittels Streams aus Strings A B C den String A, B und C machen	Allgemeine Java-Themen	12	27. Mrz 2020
M	Programm erkennt String aus .txt Datei nicht	Allgemeine Java-Themen	3	20. Mrz 2020
P	einen public <Optinal String> in einer anderen Klasse mit einem Int vergleichen	Allgemeine Java-Themen	2	20. Feb 2020
S	Ini Text aus String parsen	Allgemeine Java-Themen	1	13. Feb 2020
T	String-Manipulation beim Ablauf in Eclipse und als JAR-File	Allgemeine Java-Themen	8	13. Feb 2020
M	String lässt sich nicht Zusammenfügen	Allgemeine Java-Themen	10	11. Feb 2020
	Wie kann ich das Wort "concrete" in einem String durch ein anderes Wort ersetzen lassen?	Allgemeine Java-Themen	5	2. Feb 2020
R	Schlüsselworte "Throw new exception" gibt nicht den String als Fehlermeldung aus	Allgemeine Java-Themen	2	2. Feb 2020
R	Variablen String mit split-Funktion aufteilen	Allgemeine Java-Themen	7	29. Jan 2020
F	Datei in String-Array einlesen	Allgemeine Java-Themen	8	21. Jan 2020
S	Marker aus String ermitteln	Allgemeine Java-Themen	5	9. Jan 2020
T	Objekt mit String und Int aus TxT Datei erstellen	Allgemeine Java-Themen	23	19. Dez 2019
M	Bei String.format ein Komma statt einem Punkt ausgeben lassen	Allgemeine Java-Themen	1	29. Nov 2019
S	MSSQL Exception & Connection String	Allgemeine Java-Themen	19	23. Nov 2019
B	Bei Email: FW / AW... - Hilfe bei String suche	Allgemeine Java-Themen	21	6. Nov 2019
J	String - Vergleiche	Allgemeine Java-Themen	7	17. Okt 2019
K	Aus String zwei Jahreszahlen auslesen	Allgemeine Java-Themen	18	1. Okt 2019
	Wie kann eine vorgegebene Farbe über einen String erkannt werden?	Allgemeine Java-Themen	11	26. Mai 2019
G	CSV in String	Allgemeine Java-Themen	7	12. Apr 2019
P	String-Verschlüsselung - Frage zur Sicherheit	Allgemeine Java-Themen	21	26. Mrz 2019
K	Methodenaufruf mit String / String zu Objekt konvertieren	Allgemeine Java-Themen	8	27. Feb 2019
D	Erste Schritte Fehler mit negativen und 0 Zahlen im String	Allgemeine Java-Themen	6	26. Feb 2019
	Replace x Zeichen aus String	Allgemeine Java-Themen	2	11. Feb 2019
	warum bekomme ich ein string index out of bounds exception	Allgemeine Java-Themen	17	5. Feb 2019
F	In String 2 Buchstaben vertauschen	Allgemeine Java-Themen	2	14. Dez 2018
J	Class Decompile als String (Procyon)	Allgemeine Java-Themen	2	29. Okt 2018
I	Datentypen String in class sicher verwahren	Allgemeine Java-Themen	17	7. Aug 2018
J	Falls der String ein "X" beinhaltet	Allgemeine Java-Themen	2	6. Jul 2018
T	String mehrere Worte	Allgemeine Java-Themen	2	30. Jun 2018
D	String Groß-/Kleinschreibung	Allgemeine Java-Themen	2	6. Jun 2018
D	String und Klassenvariable	Allgemeine Java-Themen	6	15. Mai 2018
	Funktion(y = mx+n) in String speichern und berechnen	Allgemeine Java-Themen	9	12. Mai 2018
C	String in Objektnamen umwandeln	Allgemeine Java-Themen	3	24. Apr 2018
E	Variablen Aus .txt ausgelesener string mit if() überprüfen?	Allgemeine Java-Themen	2	14. Apr 2018
L	String-Schema-Aufspaltung	Allgemeine Java-Themen	2	20. Dez 2017
E	String in Zahl umwandeln, ohne Befehl Integer.parseInt	Allgemeine Java-Themen	3	10. Dez 2017
L	String splitten und multiplizeren	Allgemeine Java-Themen	10	7. Dez 2017
G	String mit umbekannter länge splitten.	Allgemeine Java-Themen	2	2. Dez 2017
S	Einzigartigen String in Datenbank finden und löschen	Allgemeine Java-Themen	23	22. Nov 2017
A	Byte zu String	Allgemeine Java-Themen	4	5. Nov 2017
B	Von String zu <Objekt> \|\|Speichern/Laden	Allgemeine Java-Themen	17	4. Nov 2017
T	Komplexitätsoptimierung String vergleich	Allgemeine Java-Themen	4	11. Okt 2017
	String im JLabel ausgeben und erneuern	Allgemeine Java-Themen	6	9. Okt 2017
S	Input/Output Beste Möglichkeit einen String in einen Datei zu Schreiben	Allgemeine Java-Themen	2	27. Sep 2017
V	Eingegeben String Splitten und in Integer umwandeln	Allgemeine Java-Themen	2	26. Aug 2017
L	Decrypt String	Allgemeine Java-Themen	1	22. Aug 2017
X	Variablen AtmicLong größer als String ?	Allgemeine Java-Themen	4	19. Aug 2017
S	String literal und Referenzvariablen	Allgemeine Java-Themen	6	19. Aug 2017
J	Datentypen Absätze mit String im Word Dokument	Allgemeine Java-Themen	3	29. Jul 2017
D	"Paste" String doppelt	Allgemeine Java-Themen	14	10. Jul 2017
E	String Frage	Allgemeine Java-Themen	9	6. Jul 2017
T	String aus While Schleife für ganze Klasse sichtbar machen	Allgemeine Java-Themen	5	30. Jun 2017
D	JSON to String	Allgemeine Java-Themen	31	19. Jun 2017
M	String automatisch in nächste Zeile umbrechen (Graphics)	Allgemeine Java-Themen	6	15. Jun 2017
U	Methoden Algorithmus MergeSort String [ ] array sortieren programmieren	Allgemeine Java-Themen	17	1. Apr 2017
T	Swing Font String Pixellänge	Allgemeine Java-Themen	1	19. Mrz 2017
G	Substrings in einen String zusammenfassen	Allgemeine Java-Themen	5	20. Feb 2017
	String.replaceAll(...) fehlerhaft?	Allgemeine Java-Themen	3	3. Feb 2017
L	String auf zahlenwert prüfen	Allgemeine Java-Themen	13	3. Jan 2017
U	OOP Warum kann ich aus meiner Methode keinen String auslesen	Allgemeine Java-Themen	4	21. Dez 2016

String.substring und UTF-16-Konformität [solved]

wolfgke

Mitglied

SlaterB

Gast

wolfgke

Mitglied

didjitalist

Bekanntes Mitglied

Murray

Top Contributor

wolfgke

Mitglied

Ähnliche Java Themen

Aktuelle Jobs

Neue Themen