Abwärtskompatibilität des Unicode

Status
Nicht offen für weitere Antworten.

Revenant

Aktives Mitglied
Hi,

wie ich hier gelesen habe ist der Unicode Zeichensatz in den ersten 256 Zeichen abwärtskompatibel zum ISO-Latin-1 Zeichensatz. Im ISO-Latin-1 Zeichensatz ISO-8859-1 liegt das das "ä" an Stelle 228 (E4) und im Unicode Zeichensatz auch an Stelle 228. Wenn ich also über ein Formular einer Webseite ein "ä" im Zeichensatz ISO 8859-1 einlese und dann mit Java in eine Datei schreibe (bei mir eine .xml Datei) warum wird das Zeichen dann nicht richtig angezeigt? Java schreibt doch nach diesem Dokument immer im Unicode. :autsch:

Klar ich kann durch:

Code:
PrintWriter outp = new PrintWriter( new OutputStreamWriter(new FileOutputStream(sExportFile), "UTF8") );
        		outp.print(sResult.toString());
       	 		outp.close();

den eingelesene ANSI Zeichensatz richtig konvertieren, aber theoretisch müsste es ja auch ohne gehen. Hoffe es kann mir jemand helfen
 

kaie

Bekanntes Mitglied
Die Länge eines UTF-8-Zeichens ist abhängig von seinem Wert. So werden alle Zeichen mit ASCII-Code unter 128 mit nur einem Byte, alles darüber mit 2 oder mehr Bytes dargestellt. Genaueres dazu liefert Wikipedia, Abschnitt Kodierung.

Unicode != UTF-8
 

Revenant

Aktives Mitglied
Ok, das erklärt mein Problem.

EDIT:
Ist meine Quelle dann fehlerhaft und der Unicode immer in den ersten 128 Zeichen abwärtskompatibel, oder liegt das an meinem Umwandlungsformat, dem utf8?
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
G Abwärtskompatibilität Allgemeine Java-Themen 19
S Warnings beheben oder Abwärtskompatibilität waren Allgemeine Java-Themen 9
B JVM - Abwärtskompatibilität Allgemeine Java-Themen 8
_user_q JavaFX Robot alle Unicode-Zeichen schreiben lassen können Allgemeine Java-Themen 12
J Unicode Darstellung mit 5 chars Allgemeine Java-Themen 9
E Compiler-Fehler Unicode Zeichen einlesen Allgemeine Java-Themen 1
L UTF8 to Unicode Allgemeine Java-Themen 9
mrBrown Unicode-WhiteSpaces aus String entfernen Allgemeine Java-Themen 14
S Input/Output Unicode Umwandlung Allgemeine Java-Themen 2
H Unicode ausgeben ohne Umwandlung - geht das? Allgemeine Java-Themen 3
L Problem bei ausführbarer jar Datei mit Unicode-Zeichen Allgemeine Java-Themen 4
J Unicode als String Allgemeine Java-Themen 6
R kopieren von Dateien und Verzeichnissen - UNICODE? Allgemeine Java-Themen 4
P JavaDoc und Backslashes: "Invalid unicode" Allgemeine Java-Themen 3
H Exponenten mit UNICODE Allgemeine Java-Themen 4
N Encoding Unicode Textfile Allgemeine Java-Themen 5
M Unicode 06 (Arabic) Allgemeine Java-Themen 5
P Unicode-Sequenz (u1234) in Variable speichern und ausgeben Allgemeine Java-Themen 6
P Unicode-Problem: Griechische Buchstaben Allgemeine Java-Themen 11
J Unicode: cmd parameter (main args); exec params; filenames Allgemeine Java-Themen 2
Daniel_L ASCII in UniCode umwandeln? Allgemeine Java-Themen 14
Luma Unicode Steuerzeichen von druckbaren Zeichen trennen Allgemeine Java-Themen 10
L unicode-zeichen in ein txt-File schreiben Allgemeine Java-Themen 3
L unicode Allgemeine Java-Themen 5
F Unicode zu ASCII konvertieren Allgemeine Java-Themen 5
oliver1974 Wie ResourceBundles mit Unicode Zeichen korrekt einlesen? Allgemeine Java-Themen 4
I Eignung eines Zeichensatzes zur Kodierung eines Unicode-Str. Allgemeine Java-Themen 3
D Zeilenweises auslesen aus einer Unicode CSV-Datei Allgemeine Java-Themen 7
U unicode oder was? Allgemeine Java-Themen 14
R Unicode (Kyrillisch) Allgemeine Java-Themen 15
byte Unicode Sonderzeichen Allgemeine Java-Themen 2
B Unicode für Kreuz gesucht Allgemeine Java-Themen 2
H Unicode Darstellung in Java, spezielles Zeichen gesucht Allgemeine Java-Themen 4
S Unicode-Zeichen erstellen/ Kodierung Allgemeine Java-Themen 4
G Unicode file auslesen Allgemeine Java-Themen 11
C Unicode für Promille-Zeichen Allgemeine Java-Themen 5
U Unicode char kyrillisch Allgemeine Java-Themen 10
G Unicode eines Zeichens ermitteln Allgemeine Java-Themen 5

Ähnliche Java Themen

Neue Themen


Oben