Convert UTF-8 String to ANSI

Status
Nicht offen für weitere Antworten.

klaesmann

Mitglied
Hallo zusammen!

Folgendes Problem:
Ich möchte gerne einen bereits in UTF-8 konvertierten String mit Java in ANSI konvertieren.
Dabei sollten alle Sprachen bzw. alle Ländercodes gelten, sofern per UTF-8 darstellbar.
Dazu ein Beipsiel, welches mit Notepad++ convertiert wurde:

Der UTF-8 String:
مل على مدار اليوم. يمكنك مشاهدة ب
ANSI String:
مل على مدار اليوم. يمكنك مشاهدة ب

Dazu mein Code-Snippet:
Code:
String content = "مل على مدار اليوم. يمكنك مشاهدة ب";
String ansi = new String (content.getBytes("UTF-8"),"ANSI");
Habe das ganze schon mit ASCII, ISO-8859-1 anstelle von ANSI probiert.

Ich habe gelesen das Java generell Schwierigkeiten mit dem konvertieren von UTF-8 nach ANSI hat.
Stimmt das? (Siehe Blog Entry auf Sun) (Sorry, hab den Link net mehr)

Vielen Dank für Eure Hilfe.
 

ModellbahnerTT

Bekanntes Mitglied
Das Encoding heißt Windows-1252
Und du weißt schon, dass selbiger Zeichensatz nur 128 Zeichen kennt? Wenn du versuchst arabische Zeichen mit dem Zeichensatz darzustellen kommt nur Müll raus (was Notepad++ dir ausspuckt)

Dass dein Quelltext quatscht ist hast du ja offenbar schon selbst bemerkt, was soll der bewirken? Java-Strings haben kein explizites encoding.
 

Wortraum

Bekanntes Mitglied
Ich möchte gerne einen bereits in UTF-8 konvertierten String mit Java in ANSI konvertieren.
Warum? Je nach Anwendungsgebiet gibt es verschiedene Möglichkeiten, beispielsweise Base64, aber ohne Rückkonvertierung kannst Du die arabischen Zeichen nicht darstellen. UTF-8 dient als Kodierung für Unicode, das derzeit etwa 100.000 Zeichen enthält; ANSI enthält 128 Zeichen, wovon 32 Zeichen reine Steuerzeichen sind.
 

sliwalker

Top Contributor
Wie schon gesagt wurde,

wenn die Zeichen in Deinem String nicht im ANSI bzw. ASCII Bereich liegen, also im Dezimalbereich von 0 - 127, dann können sie nicht interpretiert werden bzw. es kommt Bitmurks raus. Nimm einen zwei Bytes großes Encoding und zeige nur ein Byte davon an. Kannst Dir vorstellen, dass das nicht klappt, wie man will.

Dein Vorhaben ist schlichtweg nicht möglich. Hab was von Rückkonvertierung gelesen, was ich so nicht stehen lassen kann. UTF-8, ANSI und auch ASCII sind im Dezimalbereich von 0 - 127 (nahezu) identisch. ANSI und ASCII unterscheiden sich dann nur noch unterschiedlich (je nach Codepage) im Dezimalbereich von 128 - 255.
UTF-8 kann alle bislang bekannten Sprachen aufnehmen, weil es ein vier Bytes großes Encoding ist.

Es bringt da auch nichts mit ISO rumzuspielen, da nicht gewährleistet ist, dass Dein UTF-8 codierter String überhaupt in ISO angezeigt werden kann. ISO ist keine Teilmenge von UTF-8. Zumindest nicht mathematisch gesehen. ISO zeigt Zeichen aus UTF-8 an, ja, aber mittels unterschiedlicher Codepoints.

Dein String hat ein Standardencoding. UTF-16, außer Du sagt ihm etwas anderes.
 
S

Spacerat

Gast
Wenn man's genau nimmt, unterscheidet sich ASCII (7 Bit; 128 Zeichen) von UTF8 oder ANSI überhaupt nicht, was die ASCII relevanten Zeichen angeht. Erst beim erweiterten ASCII (8 Bit; 256 Zeichen) wirds interessant. Im Codebereich 128 bis 255 gibt es dann nämlich verschiedene Belegungen wie ANSI, UTF8, IBM (DOS-Extension) usw. Mit anderen Worten: ANSI, UTF8, IBM sind Varianten des erweiterten ASCII Zeichensatzes (liesmich).
Der erste Satz der bei der Insel
Java kodiert Texte durch Unicode-Zeichen. Jedem Zeichen ist ein eindeutiger Zahlenwert (engl. code point) zugewiesen, sodass zum Beispiel das große A an Position 65 liegt. Der Unicode-Zeichensatz beinhaltet die ISO-US-ASCII-Zeichen von 0 bis 127 (hexadezimal 0x00 bis 0x7f, also 7 Bit) und die erweiterte Kodierung nach ISO 8859-1 (Latin-1), die Zeichen von 128 bis 255 hinzunimmt.
lässt den Schluss zu, das sich UTF8 sehr wohl nach ANSI konvertieren lässt, jedoch als String dann nicht mehr korrekt angezeigt wird, solange die von Java verwendete Codepage nicht auch angepasst wird.
 
Zuletzt bearbeitet von einem Moderator:

Wortraum

Bekanntes Mitglied
Natürlich läßt sich eine Zeichenkette von einer Kodierung in die andere überführen, weshalb ich Base64 erwähnte. Fürs Speichern oder Versenden ist das nützlich, um die Zeichenkette aber „normal“ darzustellen, muß man sie rückkonvertieren.

Es gibt schlaue Köpfe, die überlegten sich sogar, daß man beliebige Daten mit einem Alphabet aus zwei Zeichen darstellen könne. Eine Ziffer nannten sie dann Bit. Gelegentlich wird das heute sogar noch genutzt. Ganz verrückte Geschichte! :D
 
S

Spacerat

Gast
Es gibt schlaue Köpfe, die überlegten sich sogar, daß man beliebige Daten mit einem Alphabet aus zwei Zeichen darstellen könne. Eine Ziffer nannten sie dann Bit. Gelegentlich wird das heute sogar noch genutzt. Ganz verrückte Geschichte! :D
Bit? Moment... Hab' ich schon mal gehört... Hmmm... Neee... Bier lass ich beim proggen aussm' Schädel... :lol:
...:oops: Meinst du etwa diese Geschicht mit den Nullen und Einsen? Weshalb denn so 'ne geringe "Auflösung"? Base64 wäre mir persönlich auch noch zu klein. Am geeignetsten zum Konvertieren ist meines Erachtens Base128 Encoding und das ist ASCII-Standard.
Andererseits... Weis gar nicht, ob es dafür Wandler in der Standard-JRE gibt, oder ob man da selber implementieren muss. Base64 ist also schon OK.
 

Wortraum

Bekanntes Mitglied
Base128, ASCII-Standard? Also wenn ich von den 128 ASCII-Zeichen die 32 Steuerzeichen abziehe, bleiben nur 96 übrig.

Base64 ist nicht standardmäßig bei Java dabei, was ich bis heute nicht verstehe. Allerdings ist es recht einfach selbst zu programmieren, und zum Testen reicht der BASE64Encoder und -Decoder aus sun.misc.
 
S

Spacerat

Gast
Wie? Wenn ich mit 'ner Standard-VM z.B. unter Eclipse "Base6" und anschliessend Codevervollständigung mache, kommen sogar eine ganze Reihe Vorschläge (z.B. "com.sun.org.apache.xerces.internal.impl.dv.util.Base64"). Ist das Standard genug?
Base128 war auch nur so daher gesagt. Gibt es ja unter dieser Bezeichnung nicht. Wenn man aber so will, kann man mit dem ASCII-Standard, welcher ja nur 7-Bit belegt, das selbe anstellen wie mit Base64. Ein derartig kodierter String würde halt nur aus Bytes mit gelöschtem Bit 8 (oder anders gesagt ASCII-Zeichen) besteht. Die Länge eines solchen Strings wäre dann eben nur 8/7 grösser, statt 4/3 bei Base64. Der Nachteil ist allerdings der, das immer noch nicht alle Zeichen druckbar sind. Das höchste, was ich finden konnte war Base85 ? Wikipedia
 
Zuletzt bearbeitet von einem Moderator:

klaesmann

Mitglied
Vielen Dank für die vielen, schnellen Antworten und Ideen.
Die Umstellung auf "Windows-1252" war der richtige Tip.
Über Sinn und Unsinn einiger gegebener Einstellungen in der DB und
auch in verschiedenen Variablen lässt sich streiten.
Anregungen Dinge schnellstmöglich zu ändern sind dabei.

Nocheinmal vielen Dank an Alle. :)
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
Flo :3 Variablen Type dismatch: cannot convert from string to int Java Basics - Anfänger-Themen 9
A convert String in Datumsformat Java Basics - Anfänger-Themen 2
E Input/Output convert string to two dimensional char and output = matrix Java Basics - Anfänger-Themen 2
S Convert InetAddress to String Java Basics - Anfänger-Themen 3
G convert Date to LocalDate Java Basics - Anfänger-Themen 11
G convert Optional<Date> into Optional<LocalDate> Java Basics - Anfänger-Themen 6
T Cannot convert from Integer to int Java Basics - Anfänger-Themen 12
M Meldung "cannot convert flom boolean to boolean[]" Java Basics - Anfänger-Themen 3
C cannot convert from int to boolean Java Basics - Anfänger-Themen 3
J convert int to hexadecimal? Java Basics - Anfänger-Themen 5
sc0p convert 2 Jar - GUI nicht komplett Java Basics - Anfänger-Themen 9
J Convert object to boolean Java Basics - Anfänger-Themen 7
K Convert Properties to File Java Basics - Anfänger-Themen 2
B Fehlermeldung: cannot convert from int to byte Java Basics - Anfänger-Themen 2
S StringToInt() - Type mismatch: cannot convert from... Java Basics - Anfänger-Themen 16
S Fehlermeldung Cant convert java.awt.TextField to int Java Basics - Anfänger-Themen 12
G "cannot convert from long to int" - problem Java Basics - Anfänger-Themen 9
S Cannot Convert Array Java Basics - Anfänger-Themen 2
krgewb String mit Datumsangabe in Long umwandeln Java Basics - Anfänger-Themen 2
D String Groß/Kleinschreibung Ignorieren Java Basics - Anfänger-Themen 4
D Map<String, Integer> sortieren und der reinfolge nach die Glieder abfragen Java Basics - Anfänger-Themen 3
J Ähnlichen String in Liste finden Java Basics - Anfänger-Themen 6
Kartoffel_1 String transformation Java Basics - Anfänger-Themen 7
H String-Operation replace() - Zeichenkette verdoppeln Java Basics - Anfänger-Themen 2
K String analysieren Java Basics - Anfänger-Themen 27
Beowend String zu Date parsen Java Basics - Anfänger-Themen 1
Beowend String auf Satzzeichen überprüfen? Java Basics - Anfänger-Themen 6
H Liste nach String-Länge sortieren Java Basics - Anfänger-Themen 1
String in ArrayList umwandeln Java Basics - Anfänger-Themen 1
I Sass Compiler und String erhalten? Java Basics - Anfänger-Themen 7
Avalon String in Double bzw. Währung konvertieren Java Basics - Anfänger-Themen 6
T Methode akzeptiert String nicht Java Basics - Anfänger-Themen 18
F Arraylist<String>Ein Wort pro Zeile Java Basics - Anfänger-Themen 6
J Schlüsselworte Prüfen, ob ein bestimmtes, ganzes Wort in einem String enthalten ist. Java Basics - Anfänger-Themen 6
N String überprüfen Java Basics - Anfänger-Themen 3
E String zerlegen aus args Java Basics - Anfänger-Themen 1
M Long-Typ in String-Änderung führt zu keinem Ergebnis bei großer Zahl Java Basics - Anfänger-Themen 11
Ostkreuz String Exception Java Basics - Anfänger-Themen 8
W Items löschen aus String Array vom Custom Base Adapter Java Basics - Anfänger-Themen 2
MoxMorris Wie macht man String[] = String[] aus einer anderer Methode? Java Basics - Anfänger-Themen 18
J String Filter Java Basics - Anfänger-Themen 5
S String Array Buchstaben um einen gewissen Wert verschieben Java Basics - Anfänger-Themen 4
R Größter zusammenhängender Block gleicher Zeichen im String Java Basics - Anfänger-Themen 1
XWing Randomizer mit einem String Java Basics - Anfänger-Themen 2
D 2D Char Array into String Java Basics - Anfänger-Themen 2
H Cast von Float nach String klappt nicht Java Basics - Anfänger-Themen 12
I Zerlegen von String Java Basics - Anfänger-Themen 3
B Beliebiger String gegeben Suche Datum in String Java Basics - Anfänger-Themen 6
I String Java Basics - Anfänger-Themen 4
I API - zurückgegebener JSON String lesen und in Entity konvertieren Java Basics - Anfänger-Themen 2
H Zu langen String aufteilen - bequeme Methode? Java Basics - Anfänger-Themen 14
W String einer Textdatei in einzelne Stringobjekte pro Zeile aufteilen Java Basics - Anfänger-Themen 14
belana wie am besten 2D Array von String to Integer Java Basics - Anfänger-Themen 18
J Java To String Methode, Array mit For-Schleife Java Basics - Anfänger-Themen 2
M Kommandozeilenparamter als EINEN String werten Java Basics - Anfänger-Themen 5
M RandomAccessFile int und String gleichzeitig in einer Datei Java Basics - Anfänger-Themen 49
M Prüfen on eine Zahl im String enthalten ist Java Basics - Anfänger-Themen 3
Distanz zwischen zwei Zeichenfolgen in einem String bestimmen Java Basics - Anfänger-Themen 5
Substring in einem String finden Java Basics - Anfänger-Themen 13
BeginnerJava String mit vorgegebener Länge und Buchstaben erzeugen/ mit Leerstellen Java Basics - Anfänger-Themen 8
I Eindeutiger String mit maximaler Anzahl an Zeichen Java Basics - Anfänger-Themen 11
H Interface Wieso "List<String> list = new ArrayList<>[…]" Java Basics - Anfänger-Themen 4
JavaBeginner22 Integer in String umwandeln Java Basics - Anfänger-Themen 7
HolyFUT JSON String in Java Object schreiben - Anführungszeichen rauskriegen? Java Basics - Anfänger-Themen 17
Fodoboo131 RegEx- Umwandlung von String in ausführbares Objekt/ Befehl Java Basics - Anfänger-Themen 9
HolyFUT Input/Output Leerzeichen aus String entfernen - klappt nicht! Java Basics - Anfänger-Themen 13
viktor1 Methoden Methode schreiben static void readText (String filename) {...} zu WordHistogramSample.java Java Basics - Anfänger-Themen 13
ravenz Schleife mit for über String Array „zahlen“und prüfen ob Wert „a“ oder „b“ oder „c“ entspricht (mittels || ) Java Basics - Anfänger-Themen 4
G Position einer unbekannten 3-stelligen-Zahl in einem String finden Java Basics - Anfänger-Themen 15
T String Array Fehler beim Index Java Basics - Anfänger-Themen 3
H Erste Schritte Nach einer Zahl n soll n Mal der String untereinander ausgegeben werden Java Basics - Anfänger-Themen 3
X Datentypen String.equals funktioniert nicht Java Basics - Anfänger-Themen 5
Alen123 String wiederholen mit Schleifen Java Basics - Anfänger-Themen 1
A String split funktioniert nicht, wenn mehr als 1 Ziffer vor dem Zeichen steht nach dem er trennen soll? Java Basics - Anfänger-Themen 4
T String splitten Java Basics - Anfänger-Themen 3
sserio Schwimmen als Spiel. Problem mit to String/ generate a card Java Basics - Anfänger-Themen 4
J Datentypen String in File konvertieren funktioniert nicht Java Basics - Anfänger-Themen 4
T Platzhalter in String? Java Basics - Anfänger-Themen 14
M String mit Variable vergleichen Java Basics - Anfänger-Themen 9
I String Kombination erstellen anhand fortlaufender Zahl (Vertragsnummer) Java Basics - Anfänger-Themen 13
Fats Waller Compiler-Fehler Kann ich einen String und die Summe zweier Char Werte mittels der println Anweisung ausgeben Java Basics - Anfänger-Themen 4
M Wie kann eine Methode (string) eine andere Methode (void) mit zufälligen int-Werten aufrufen? Java Basics - Anfänger-Themen 4
P9cman Vokale in einem String überprüfen mittels Rekursion Java Basics - Anfänger-Themen 8
schredder Strings und reguläre Ausdrücke - Methode mit return string.matches Java Basics - Anfänger-Themen 5
R Ein Multidimensionales String Array initialisieren und Deklarieren Java Basics - Anfänger-Themen 2
H String Repräsentation eines Rechtecks mit Instanz-Methode Java Basics - Anfänger-Themen 8
Dorfschmied Kartesisches Produkt von zwei Liste mit Hashmaps<String,String> erstellen Java Basics - Anfänger-Themen 4
S String mit Int input vergleichen Java Basics - Anfänger-Themen 5
C String/Char-API Java Basics - Anfänger-Themen 13
U Char zu einem String machen Java Basics - Anfänger-Themen 1
B Anzahl Nullen uns Einsen in String ermitteln Java Basics - Anfänger-Themen 3
T Leerzeichen im String entfernen Java Basics - Anfänger-Themen 6
Jose05 Nullpointerexception bei Umwandlung von String zu int Java Basics - Anfänger-Themen 2
O Ich habe einen String und soll mit matches schauen, ob ein Buchstabe zu einer geraden ANzahl im String vorkommt, wie soll das gehen? Java Basics - Anfänger-Themen 7
M String beim einlesen formatieren Java Basics - Anfänger-Themen 12
N null in String replacen Java Basics - Anfänger-Themen 16
R Compiler-Fehler JTable mit XML befüllen | The constructor JTable(Object[], String[]) is undefined Java Basics - Anfänger-Themen 10
M Eclipse kennt keine String Klasse mehr Java Basics - Anfänger-Themen 1
M Frage zur Methode split der Klasse String Java Basics - Anfänger-Themen 32
D String mit int multiplizieren? Java Basics - Anfänger-Themen 16

Ähnliche Java Themen

Neue Themen


Oben