URLDecoder und chinesische Schriftzeichen

d3n1s · 12. Mrz 2010

ein vb scribt macht mir mit "escape(url)" ein escape aus einer url, welche chinesische schriftzeichen enthält. in java möchte ich nun die url wieder decodieren.
wenn sich in der url keine chinesischen schriftzeichen befinden, funktioniert das mit:

Java:

decodedUrl = URLDecoder.decode(url,"UTF-8");

werden allerdings chinesische schriftzeichen benutzt, bekomme ich folgende exception:
java.lang.IllegalArgumentException: URLDecoder: Illegal hex characters in escape (%) pattern - For input string: "u2"

hat jemand einen lösungsvorschlag??

faetzminator · 12. Mrz 2010

Bist du sicher, dass diese Schriftzeichen mit UTF-8 abgebildet werden können? Sieht nicht so aus. Verwende das Charset, welches die chinesischen Schriftzeichen beinhaltet.

d3n1s · 12. Mrz 2010

da bin ich mir nicht sicher, ja... hab aber bei wikipedia folgendes gefunden:

In UTF-8 werden ASCII-Zeichen in einem Byte kodiert und chinesische Zeichen in drei oder vier Bytes.
In UTF-16 werden ASCII-Zeichen in zwei Bytes kodiert und chinesische Zeichen in zwei oder vier Bytes.
In UTF-32 werden ausnahmslos alle Zeichen in vier Bytes kodiert.

	Titel	Forum	Antworten	Datum
G	Input/Output URLDecoder.decode - Unterschiedliche Ergebnisse Windows / Linux	Allgemeine Java-Themen	2	2. Jun 2011
B	URLDecoder.decode klappt net	Allgemeine Java-Themen	6	11. Nov 2004
X	Chinesische Schriftzeichen aus String entfernen	Allgemeine Java-Themen	6	21. Dez 2010
V	Chinesische Zeichen Escapen	Allgemeine Java-Themen	4	15. Sep 2010

URLDecoder und chinesische Schriftzeichen

d3n1s

Mitglied

faetzminator

Gesperrter Benutzer

d3n1s

Mitglied

Ähnliche Java Themen

Aktuelle Jobs

Neue Themen