UTF8 to Unicode

Langer

Mitglied
Ich habe ein seltsames Problem:
Ich habe einen String:
{"total":9,"per_page":"25","current_page":1,"last_page":1,"next_page_url":null,"prev_page_url":null,"from":1,"to":9,"data": ................. }

und lasse mir diesen zerlegen, umwandeln und dann ausgeben:

Java:
//zerlegen:
    String[] parts = test.split(":");
//UTF8->Unicode:
    for(int i=0;i<(parts.length);i++){
               if(parts[i].contains("title"))                 //suche nur "titel-Einträge"
               {
                   String s1 =parts[i+1].replace("\"","").split(",")[0];
                   //s1="Blu ray player philips bdp 3380 - defekt - f\u00fcr Bastler - Reparaturf\u00e4hig" DAS FUNKTIONIERT DANN...
                   byte[] bytes = s1.getBytes("UTF-8");
                   String s2 = new String(bytes, "UTF-8");
                    System.out.println(s2);
                 }
    }

Ausgabe:
Blu ray player philips bdp 3380 - defekt - f\u00fcr Bastler - Reparaturf\u00e4hig

Wenn ich jetzt diese Ausgabe nehme und sage:
s1="Blu ray player philips bdp 3380 - defekt - f\u00fcr Bastler - Reparaturf\u00e4hig"
ist die Ausgabe richtig mit "ü" übersetzt.

Wie löse ich das Problem und warum funktioniert es nicht?!
 

Langer

Mitglied

Thallius

Top Contributor
Tja die Frage is WIE du sie von der Webseite geholt hast. Wenn du einfach den HMTL Sourcecode eingeladen hast, dann solltest du mal im header schaun was du da bekommst.
 

Langer

Mitglied
Tja die Frage is WIE du sie von der Webseite geholt hast. Wenn du einfach den HMTL Sourcecode eingeladen hast, dann solltest du mal im header schaun was du da bekommst.
Ich denke nicht, dass es hier wichtig ist. Ich speichere die Daten in einen String. Diesen String zerlege ich dann.
Der String sieht dann aus, wie oben gezeigt wenn ich ihn per System.out.println(test) ausgebe.

Ich lasse mich aber gern verbessern...
 
Zuletzt bearbeitet:

Langer

Mitglied
Der Code, mit dem ich die Homepagedaten bekomme:

Code:
 private String GetPageContent(String url) throws Exception {

        URL obj = new URL(url);
        conn = (HttpsURLConnection) obj.openConnection();

        // default is GET
        conn.setRequestMethod("GET");

        //conn.setUseCaches(false);

        // act like a browser
        conn.setRequestProperty("Accept","text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8");
        conn.setRequestProperty("Accept-Encoding","gzip, deflate, sdch, br");
        conn.setRequestProperty("Accept-Language", "de-DE,de;q=0.8,en-US;q=0.6,en;q=0.4,es;q=0.2");
        conn.setRequestProperty("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36");
        conn.setRequestProperty("Upgrade-Insecure-Requests", "1");
        conn.setRequestProperty("Referer", "https://www.goofbid.com/auth/login?referer=%3F");
        conn.setRequestProperty("Cache-Control", "max-age=0");
       
        String cookieString="";
       
         for (String cookie : this.cookies) {
                 if((cookie.contains("session")&cookie.length()>120)|cookie.contains("__cfduid")|cookie.contains("user_id")){
                     cookieString+=(cookie.split(";",2)[0])+"; ";
                    
                 }
            }
         conn.addRequestProperty("Cookie",cookieString);
       
       
        int responseCode = conn.getResponseCode();
        //System.out.println("\nSending 'GET' request to URL : " + url);
        //System.out.println("Response Code : " + responseCode);

        BufferedReader in =
                new BufferedReader(new InputStreamReader( new GZIPInputStream(conn.getInputStream())));
        String inputLine;
        StringBuffer response = new StringBuffer();

        while ((inputLine = in.readLine()) != null) {
            response.append(inputLine);
        }
        in.close();

        // Get the response cookies
        setCookies(conn.getHeaderFields().get("Set-Cookie"));
       
       
        return response.toString();

      }

Liegt bei dem fett gedruckten vlt das Problem? Aber wie gesagt, wenn ich System.out.println(http.GetPageContent("https://www.goofbid.com/api/sniper?page=1&per_page=25&show=finished");) eingebe bekomme ich UTF-8 Code:
{"total":9,"per_page":"25","current_page":1,"last_page":1,"next_page_url":null,"prev_page_url":null,"from":1,"to":9,"d ..................}
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
B Input/Output Encoding ISO->UTF8 Allgemeine Java-Themen 3
C Auslesen + Bearbeiten einer UTF8 Datei Allgemeine Java-Themen 5
S Bytearrays und UTF8 Allgemeine Java-Themen 2
K Zeichensatz in UTF8 konvertieren Allgemeine Java-Themen 7
M problem mit utf8 kodierten propertie-dateien Allgemeine Java-Themen 2
_user_q JavaFX Robot alle Unicode-Zeichen schreiben lassen können Allgemeine Java-Themen 12
J Unicode Darstellung mit 5 chars Allgemeine Java-Themen 9
E Compiler-Fehler Unicode Zeichen einlesen Allgemeine Java-Themen 1
mrBrown Unicode-WhiteSpaces aus String entfernen Allgemeine Java-Themen 14
S Input/Output Unicode Umwandlung Allgemeine Java-Themen 2
H Unicode ausgeben ohne Umwandlung - geht das? Allgemeine Java-Themen 3
L Problem bei ausführbarer jar Datei mit Unicode-Zeichen Allgemeine Java-Themen 4
J Unicode als String Allgemeine Java-Themen 6
R kopieren von Dateien und Verzeichnissen - UNICODE? Allgemeine Java-Themen 4
P JavaDoc und Backslashes: "Invalid unicode" Allgemeine Java-Themen 3
H Exponenten mit UNICODE Allgemeine Java-Themen 4
N Encoding Unicode Textfile Allgemeine Java-Themen 5
M Unicode 06 (Arabic) Allgemeine Java-Themen 5
P Unicode-Sequenz (u1234) in Variable speichern und ausgeben Allgemeine Java-Themen 6
P Unicode-Problem: Griechische Buchstaben Allgemeine Java-Themen 11
J Unicode: cmd parameter (main args); exec params; filenames Allgemeine Java-Themen 2
Daniel_L ASCII in UniCode umwandeln? Allgemeine Java-Themen 14
Luma Unicode Steuerzeichen von druckbaren Zeichen trennen Allgemeine Java-Themen 10
L unicode-zeichen in ein txt-File schreiben Allgemeine Java-Themen 3
L unicode Allgemeine Java-Themen 5
F Unicode zu ASCII konvertieren Allgemeine Java-Themen 5
oliver1974 Wie ResourceBundles mit Unicode Zeichen korrekt einlesen? Allgemeine Java-Themen 4
I Eignung eines Zeichensatzes zur Kodierung eines Unicode-Str. Allgemeine Java-Themen 3
D Zeilenweises auslesen aus einer Unicode CSV-Datei Allgemeine Java-Themen 7
U unicode oder was? Allgemeine Java-Themen 14
R Abwärtskompatibilität des Unicode Allgemeine Java-Themen 2
R Unicode (Kyrillisch) Allgemeine Java-Themen 15
byte Unicode Sonderzeichen Allgemeine Java-Themen 2
B Unicode für Kreuz gesucht Allgemeine Java-Themen 2
H Unicode Darstellung in Java, spezielles Zeichen gesucht Allgemeine Java-Themen 4
S Unicode-Zeichen erstellen/ Kodierung Allgemeine Java-Themen 4
G Unicode file auslesen Allgemeine Java-Themen 11
C Unicode für Promille-Zeichen Allgemeine Java-Themen 5
U Unicode char kyrillisch Allgemeine Java-Themen 10
G Unicode eines Zeichens ermitteln Allgemeine Java-Themen 5

Ähnliche Java Themen

Neue Themen


Oben