Unicode char kyrillisch

Status
Nicht offen für weitere Antworten.

ulr!ch

Bekanntes Mitglied
Hi JavaGemeinde,

ich habe hier ein Problem mit einer txt-Datei die im UniCode-Format abgespeichert kyrillische Buchstaben enthält. Wenn ich die Zeichen in einen String konvertiere, gehen sie verloren. Deswegen alles über char laufen lassen.
Gibt es so etwas wie den StringTokenizer für char? Wie kann ich die char-Sequence splitten (Trennzeichen: Leerzeichen)? Danke für jede Art von Hilfe vorab.

By<e Ulrich
 
S

stev.glasow

Gast
Im String Kostruktor
String(byte[] bytes, String charsetName)
kannst du einen Zeichensatz angeben, bringt das was?

Und eine charsequenz könntest du spiltten in dem du nach dem Leerzeichen suchst und dir die Teile über subSequence(int start, int end) holst.
 

thE_29

Top Contributor
Mit dem Konstruktor von Stevi funktioniert das richtige Anzeigen!

Habe mich mit dem auch schon lange genug rumgequählt und nach einer gewissen Zeit hats dann funktioniert ;)

Jedenfalls, hättest du dir so auch die char[] Arrays sparen können ;)
 

ulr!ch

Bekanntes Mitglied
Hi JavaGemeinde,

danke für die Antworten, die helfen mir schon sehr weiter. :)
Ich habe noch ein kleines Problem, ich kriege beim Auslesen der Datei ein char[], aber im String-Konstruktor muss - falls man die Zeichentabelle angeben möchte - byte[] stehen.
Wieso funktioniert das casten s. u. nicht?
Was mache ich falsch?

Code:
char[] data = new char[size];
String text = new String((data)byte[], 0, chars_read, "ISO-8859-5");

Thx a lot! Super Forum,

By<e Ulrich
 

thE_29

Top Contributor
Wieso liest du es nicht gleich in ein byte stream ein??

Ansonsten musst du es per Hand kopieren... (also ein neues byte[] und die Inhalte kopieren)
 

ulr!ch

Bekanntes Mitglied
thE_29 hat gesagt.:
Wieso liest du es nicht gleich in ein byte stream ein??
Ansonsten musst du es per Hand kopieren... (also ein neues byte[] und die Inhalte kopieren)

Das habe ich versucht, aber dann beschwert er sich, dass ein Genauigkeitsverlust möglich sein könnte und wie ich den vermeide, habe ich bisher noch nicht herausbekommen.
Hier der Code:
Code:
byte[] dataByte = new byte[size];
for (int i=0; i<=size; i++) {
  dataByte[i] = (data[i]);
}

Eine Idee?
Ich versuche dass jetzt mal mit dem ByteStream, was du meintest.
Mal sehen, ob ich das hinbekomme.

By<e Ulrich
 

molotov

Mitglied
Die kyrillischen Zeichen haben in Unicode die dezimalen Codes 1024 bis 1151.
Die Konvertierung in byte könnte daher ein Problem werden, nehm ich an...
 

thE_29

Top Contributor
Nope!

Wenn du sie Ausgeben lässt (die byte Werte) so schreibt er auch 1024 hin ;)

Das ist das sehr komische, aber gehn tuts. Nur wird mit einem nicht unterstützten Zeichensatz konvertiert, so haben sie den Wert 655535 bzw irgendsoeinen Wert.
 

Bleiglanz

Gesperrter Benutzer
was soll das?

warum nimmst du nicht gleich einen Reader, stellst das Encoding ein und bekommst so einen String???
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
_user_q JavaFX Robot alle Unicode-Zeichen schreiben lassen können Allgemeine Java-Themen 12
J Unicode Darstellung mit 5 chars Allgemeine Java-Themen 9
E Compiler-Fehler Unicode Zeichen einlesen Allgemeine Java-Themen 1
L UTF8 to Unicode Allgemeine Java-Themen 9
mrBrown Unicode-WhiteSpaces aus String entfernen Allgemeine Java-Themen 14
S Input/Output Unicode Umwandlung Allgemeine Java-Themen 2
H Unicode ausgeben ohne Umwandlung - geht das? Allgemeine Java-Themen 3
L Problem bei ausführbarer jar Datei mit Unicode-Zeichen Allgemeine Java-Themen 4
J Unicode als String Allgemeine Java-Themen 6
R kopieren von Dateien und Verzeichnissen - UNICODE? Allgemeine Java-Themen 4
P JavaDoc und Backslashes: "Invalid unicode" Allgemeine Java-Themen 3
H Exponenten mit UNICODE Allgemeine Java-Themen 4
N Encoding Unicode Textfile Allgemeine Java-Themen 5
M Unicode 06 (Arabic) Allgemeine Java-Themen 5
P Unicode-Sequenz (u1234) in Variable speichern und ausgeben Allgemeine Java-Themen 6
P Unicode-Problem: Griechische Buchstaben Allgemeine Java-Themen 11
J Unicode: cmd parameter (main args); exec params; filenames Allgemeine Java-Themen 2
Daniel_L ASCII in UniCode umwandeln? Allgemeine Java-Themen 14
Luma Unicode Steuerzeichen von druckbaren Zeichen trennen Allgemeine Java-Themen 10
L unicode-zeichen in ein txt-File schreiben Allgemeine Java-Themen 3
L unicode Allgemeine Java-Themen 5
F Unicode zu ASCII konvertieren Allgemeine Java-Themen 5
oliver1974 Wie ResourceBundles mit Unicode Zeichen korrekt einlesen? Allgemeine Java-Themen 4
I Eignung eines Zeichensatzes zur Kodierung eines Unicode-Str. Allgemeine Java-Themen 3
D Zeilenweises auslesen aus einer Unicode CSV-Datei Allgemeine Java-Themen 7
U unicode oder was? Allgemeine Java-Themen 14
R Abwärtskompatibilität des Unicode Allgemeine Java-Themen 2
R Unicode (Kyrillisch) Allgemeine Java-Themen 15
byte Unicode Sonderzeichen Allgemeine Java-Themen 2
B Unicode für Kreuz gesucht Allgemeine Java-Themen 2
H Unicode Darstellung in Java, spezielles Zeichen gesucht Allgemeine Java-Themen 4
S Unicode-Zeichen erstellen/ Kodierung Allgemeine Java-Themen 4
G Unicode file auslesen Allgemeine Java-Themen 11
C Unicode für Promille-Zeichen Allgemeine Java-Themen 5
G Unicode eines Zeichens ermitteln Allgemeine Java-Themen 5
Aboya Char Array rekursiv vergleichen Allgemeine Java-Themen 15
R char aus String entfernen Allgemeine Java-Themen 10
Thallius Char +1 wird int? Allgemeine Java-Themen 7
MiMa Illegal char im Dateinamen Allgemeine Java-Themen 14
K Eingabe mit Char vergleichen klappt nicht! Allgemeine Java-Themen 2
JG12111989 char-Array in int-Array umwandeln Allgemeine Java-Themen 27
J char Allgemeine Java-Themen 3
Thallius Merkwürdiges StringBuilder verhalten (Char Encoding) Allgemeine Java-Themen 6
R Char cannot be derefenrenced? Allgemeine Java-Themen 14
R Bibliothek für Darstellung von char auf 5x7 Dot-Matrix Allgemeine Java-Themen 2
S Char-index aller Buchstaben..? Allgemeine Java-Themen 3
C char und char-Array als parameter übergeben Allgemeine Java-Themen 6
J char-Array löschen Allgemeine Java-Themen 5
S Klassen Zuorgnung Object-char Allgemeine Java-Themen 2
R Beste Methode: char[] c = new String(b, CHARSET).toCharArray() ? Allgemeine Java-Themen 2
Kr0e Synchronisieren: boolean,byte,char ? Allgemeine Java-Themen 2
E Short in Char? Allgemeine Java-Themen 4
F Char-Array nach einem Wort durchsuchen! Allgemeine Java-Themen 11
H Vector<Character> zu char[] castern Allgemeine Java-Themen 2
T JNI String/char-Array Allgemeine Java-Themen 8
M String[] zu Char[][] mit von toCharArray() Allgemeine Java-Themen 5
G Hex 2 char Allgemeine Java-Themen 2
M BufferedReader.read(char[] cbuf) liefert falsche Werte? Allgemeine Java-Themen 4
T Prüfen, ob Char ein Quantifier ist Allgemeine Java-Themen 6
H int in char umwandeln Allgemeine Java-Themen 7
N problem mit char Allgemeine Java-Themen 6
N Mal wieder char-encoding Probleme Allgemeine Java-Themen 5
T Frage zu char in verbindung mit int Allgemeine Java-Themen 4
B VK_? << durch char rausbekommen Allgemeine Java-Themen 8
M Class.forName und char Allgemeine Java-Themen 10
G Char-zufällig-generieren Allgemeine Java-Themen 11
T MessageDigest von einem char[] berechnen Allgemeine Java-Themen 7
Z Zeichen/char in einer Datei löschen Allgemeine Java-Themen 6
M wie wird aus char eine string kette? Allgemeine Java-Themen 4
A char in String umwandeln Allgemeine Java-Themen 3
L ein char in einem string ersetzen? Allgemeine Java-Themen 5
N char.At gibt Zeichenkette aus. aber leider 2x Allgemeine Java-Themen 10
G Wandeln von Char Wert in Zeichen? Allgemeine Java-Themen 2
C String und char[] / String[] und Vector Allgemeine Java-Themen 21
L char-Zeichen per Konsole einlesen Allgemeine Java-Themen 4
N byte zu Char Allgemeine Java-Themen 1
L Kyrillisch in Eclipse Allgemeine Java-Themen 2

Ähnliche Java Themen

Neue Themen


Oben