String und Sonderzeichen

Guest · 8. Feb 2009

Hi,

ich lese eine Internetseite aus. Etwa so:

Code:

for ( ... s = in.readline ...){
  System.out.println(s);
}

Beinhaltet die Webseite dann "Sonderzeichen" wie z.B. das "ü" dann wird mir dieses wie folgt auf der Konsole ausgegeben:

Lï¿¼hnen = Lühnen

Wie kann ich diese Sonderzeichen in die "korrekten" Zeichen ersetzen. Ein replace kommt denke ich nicht in Frage da ich nicht alle möglichen Sonderzeichen und deren Bedeutung kenne.

Jemand dazu eine Idee?

SlaterB · 8. Feb 2009

im Konstruktor des InputStreamReaders zum InputStream kannst du ein Encoding/Charset angeben,

versuch da vielleicht einige der Möglichkeiten

US-ASCII Seven-bit ASCII, a.k.a. ISO646-US, a.k.a. the Basic Latin block of the Unicode character set
ISO-8859-1 ISO Latin Alphabet No. 1, a.k.a. ISO-LATIN-1
UTF-8 Eight-bit UCS Transformation Format
UTF-16BE Sixteen-bit UCS Transformation Format, big-endian byte order
UTF-16LE Sixteen-bit UCS Transformation Format, little-endian byte order
UTF-16 Sixteen-bit UCS Transformation Format, byte order identified by an optional byte-order mark

Cp1250 für Windows

http://java.sun.com/j2se/1.4.2/docs/api/java/nio/charset/Charset.html

andre111 · 8. Feb 2009

Die Windows-Konsole verwendet Cp850

SlaterB · 9. Feb 2009

naja, so in der Art, CpIrgendwas wird da eh gänzlich nicht erwähnt

Guest · 12. Feb 2009

Ein ähnliches Probleme habe ich auch.
ReadIn ist ein DataInputStream. Der Stream sendet Text als auch Dateien. Um den Text von den Dateien zu trennen gehe ich wie folgt vor.

Ich lese so meine Daten ein:

Code:

byte bml = ReadIn.readByte();
ReadIn.read(amd, 0, bml * 16);

int first = 0;        
while ( (first < amd.length) && (amd[first] != 0)){
	st += (char) amd[first];
	first++;
}

Das Problem ist, das ich das Encoding nicht grundsätzlich umstellen möchte, da ich dann Probleme beim laden der Dateien erwarte. Gibt es eine Möglichkeit jeden einzelnen Buchstaben hier zu encoden?

sowas wie:

st += (char)[UTF-8] amd[fist]

Danke

Gast · 13. Feb 2009

Niemand eine Idee?

Ebenius · 13. Feb 2009

Bei HTML-Seiten ist es etwas kompliziert. Es gibt einen Content-Type-HTTP-Header, der enthält meist ein charset.

Code:

HTTP/1.1 200 OK
Date: Fri, 13 Feb 2009 22:28:58 GMT
Server: Apache/1.3.34
Expires: Fri, 13 Feb 2009 22:43:58 GMT
Vary: Accept-Encoding
Connection: close
Content-Type: text/html; charset=UTF-8

Und es gibt im HTML-Kopf meist auch noch eine Charset-Angabe.

Code:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML>
<HEAD>
        <META HTTP-EQUIV="CONTENT-TYPE" CONTENT="text/html; charset=UTF-8">

Und beide können sich -- wen wundert's -- unterscheiden und tun das hin und wieder auch. Wenn dem so ist, soll man den Eintrag im HTML bevorzugen.

So bekommst Du die Charset-Angabe aus dem Content-Type-HTTP-Header:

Code:

/** Determines the charset to use from the given URL connection. */ 
static Charset determineCharset(URLConnection connection) { 
  final String contentType = connection.getContentType(); 
  Charset cs = Charset.defaultCharset(); 
  if (contentType != null) { 
    final Pattern p = Pattern.compile(".*;\\s*charset=(.+)");//$NON-NLS-1$ 
    final Matcher m = p.matcher(contentType); 
    if (m.matches()) { 
      final String charsetName = m.group(1); 
      try { 
        cs = Charset.forName(charsetName); 
      } catch (IllegalCharsetNameException ex) { 
        // TODO: Logging; Using default charset due to illegal charset name 
      } catch (UnsupportedCharsetException ex) { 
        // TODO: Logging; Using default charset due to unsupported charset 
      } catch (IllegalArgumentException ex) { 
        assert false : "The charset cannot be null, here"; //$NON-NLS-1$ 
      } 
    } 
  } 
  return cs; 
}

Und wie Du die Charset-Angabe aus dem HTML herausholst, musst Du selbst herausfinden; dafür hab ich nix fertig.

Ebenius

	Titel	Forum	Antworten	Datum
F	Java Programm, das kleine Buchstaben in einem String zählen soll und bei großen Buchstaben oder Sonderzeichen abbrechen soll.	Java Basics - Anfänger-Themen	5	24. Dez 2020
C	Wie erkennt man Sonderzeichen im String?	Java Basics - Anfänger-Themen	26	18. Apr 2017
T	byte[] zu String mit Sonderzeichen	Java Basics - Anfänger-Themen	2	26. Mrz 2014
X	String Sonderzeichen/Zahlen erkennen	Java Basics - Anfänger-Themen	3	5. Apr 2012
E	String soll mit Großbuchstaben anfangen und keine Sonderzeichen enthalten	Java Basics - Anfänger-Themen	4	31. Jan 2012
S	String auf Sonderzeichen untersuchen	Java Basics - Anfänger-Themen	6	13. Nov 2010
Z	Sonderzeichen in einem String gezeichnen/bearbeiten	Java Basics - Anfänger-Themen	6	25. Apr 2010
S	Sonderzeichen in einem String erkennen	Java Basics - Anfänger-Themen	20	2. Apr 2010
M	RandomAccessFile schreibt Sonderzeichen vor String	Java Basics - Anfänger-Themen	2	27. Okt 2007
B	String mit Sonderzeichen wie " oder = überprüfen	Java Basics - Anfänger-Themen	2	3. Sep 2007
G	Newline Sonderzeichen aus File entfernen u als String speic?	Java Basics - Anfänger-Themen	3	8. Mai 2007
M	Char Array mit Sonderzeichen in String umwandeln	Java Basics - Anfänger-Themen	21	19. Dez 2005
	String mit Datumsangabe in Long umwandeln	Java Basics - Anfänger-Themen	2	9. Apr 2024
D	String Groß/Kleinschreibung Ignorieren	Java Basics - Anfänger-Themen	4	11. Mrz 2024
D	Map<String, Integer> sortieren und der reinfolge nach die Glieder abfragen	Java Basics - Anfänger-Themen	3	2. Mrz 2024
J	Ähnlichen String in Liste finden	Java Basics - Anfänger-Themen	6	20. Dez 2023
	String transformation	Java Basics - Anfänger-Themen	7	12. Nov 2023
H	String-Operation replace() - Zeichenkette verdoppeln	Java Basics - Anfänger-Themen	2	9. Nov 2023
K	String analysieren	Java Basics - Anfänger-Themen	27	25. Okt 2023
	String zu Date parsen	Java Basics - Anfänger-Themen	1	11. Jul 2023
	String auf Satzzeichen überprüfen?	Java Basics - Anfänger-Themen	6	27. Jun 2023
H	Liste nach String-Länge sortieren	Java Basics - Anfänger-Themen	1	12. Mai 2023
モ	String in ArrayList umwandeln	Java Basics - Anfänger-Themen	1	23. Apr 2023
I	Sass Compiler und String erhalten?	Java Basics - Anfänger-Themen	7	16. Mrz 2023
	String in Double bzw. Währung konvertieren	Java Basics - Anfänger-Themen	6	3. Mrz 2023
T	Methode akzeptiert String nicht	Java Basics - Anfänger-Themen	18	26. Feb 2023
F	Arraylist<String>Ein Wort pro Zeile	Java Basics - Anfänger-Themen	6	14. Feb 2023
J	Schlüsselworte Prüfen, ob ein bestimmtes, ganzes Wort in einem String enthalten ist.	Java Basics - Anfänger-Themen	6	29. Jan 2023
N	String überprüfen	Java Basics - Anfänger-Themen	3	24. Jan 2023
E	String zerlegen aus args	Java Basics - Anfänger-Themen	1	23. Jan 2023
M	Long-Typ in String-Änderung führt zu keinem Ergebnis bei großer Zahl	Java Basics - Anfänger-Themen	11	15. Jan 2023
	String Exception	Java Basics - Anfänger-Themen	8	11. Jan 2023
W	Items löschen aus String Array vom Custom Base Adapter	Java Basics - Anfänger-Themen	2	5. Jan 2023
	Wie macht man String[] = String[] aus einer anderer Methode?	Java Basics - Anfänger-Themen	18	2. Jan 2023
J	String Filter	Java Basics - Anfänger-Themen	5	20. Dez 2022
S	String Array Buchstaben um einen gewissen Wert verschieben	Java Basics - Anfänger-Themen	4	6. Dez 2022
R	Größter zusammenhängender Block gleicher Zeichen im String	Java Basics - Anfänger-Themen	1	4. Dez 2022
	Randomizer mit einem String	Java Basics - Anfänger-Themen	2	2. Dez 2022
D	2D Char Array into String	Java Basics - Anfänger-Themen	2	30. Nov 2022
H	Cast von Float nach String klappt nicht	Java Basics - Anfänger-Themen	12	24. Nov 2022
I	Zerlegen von String	Java Basics - Anfänger-Themen	3	20. Nov 2022
B	Beliebiger String gegeben Suche Datum in String	Java Basics - Anfänger-Themen	6	17. Nov 2022
I	String	Java Basics - Anfänger-Themen	4	16. Nov 2022
I	API - zurückgegebener JSON String lesen und in Entity konvertieren	Java Basics - Anfänger-Themen	2	12. Nov 2022
H	Zu langen String aufteilen - bequeme Methode?	Java Basics - Anfänger-Themen	14	21. Okt 2022
W	String einer Textdatei in einzelne Stringobjekte pro Zeile aufteilen	Java Basics - Anfänger-Themen	14	8. Okt 2022
	wie am besten 2D Array von String to Integer	Java Basics - Anfänger-Themen	18	5. Okt 2022
J	Java To String Methode, Array mit For-Schleife	Java Basics - Anfänger-Themen	2	29. Sep 2022
M	Kommandozeilenparamter als EINEN String werten	Java Basics - Anfänger-Themen	5	31. Aug 2022
M	RandomAccessFile int und String gleichzeitig in einer Datei	Java Basics - Anfänger-Themen	49	19. Aug 2022
M	Prüfen on eine Zahl im String enthalten ist	Java Basics - Anfänger-Themen	3	12. Aug 2022
モ	Distanz zwischen zwei Zeichenfolgen in einem String bestimmen	Java Basics - Anfänger-Themen	5	4. Aug 2022
モ	Substring in einem String finden	Java Basics - Anfänger-Themen	13	3. Aug 2022
	String mit vorgegebener Länge und Buchstaben erzeugen/ mit Leerstellen	Java Basics - Anfänger-Themen	8	9. Jul 2022
I	Eindeutiger String mit maximaler Anzahl an Zeichen	Java Basics - Anfänger-Themen	11	6. Jul 2022
H	Interface Wieso "List<String> list = new ArrayList<>[…]"	Java Basics - Anfänger-Themen	4	22. Jun 2022
	Integer in String umwandeln	Java Basics - Anfänger-Themen	7	10. Jun 2022
	JSON String in Java Object schreiben - Anführungszeichen rauskriegen?	Java Basics - Anfänger-Themen	17	9. Jun 2022
	RegEx- Umwandlung von String in ausführbares Objekt/ Befehl	Java Basics - Anfänger-Themen	9	8. Jun 2022
	Input/Output Leerzeichen aus String entfernen - klappt nicht!	Java Basics - Anfänger-Themen	13	22. Mai 2022
	Methoden Methode schreiben static void readText (String filename) {...} zu WordHistogramSample.java	Java Basics - Anfänger-Themen	13	9. Mai 2022
	Schleife mit for über String Array „zahlen“und prüfen ob Wert „a“ oder „b“ oder „c“ entspricht (mittels \|\| )	Java Basics - Anfänger-Themen	4	3. Mai 2022
G	Position einer unbekannten 3-stelligen-Zahl in einem String finden	Java Basics - Anfänger-Themen	15	28. Apr 2022
T	String Array Fehler beim Index	Java Basics - Anfänger-Themen	3	15. Apr 2022
H	Erste Schritte Nach einer Zahl n soll n Mal der String untereinander ausgegeben werden	Java Basics - Anfänger-Themen	3	7. Apr 2022
X	Datentypen String.equals funktioniert nicht	Java Basics - Anfänger-Themen	5	28. Mrz 2022
	String wiederholen mit Schleifen	Java Basics - Anfänger-Themen	1	20. Mrz 2022
A	String split funktioniert nicht, wenn mehr als 1 Ziffer vor dem Zeichen steht nach dem er trennen soll?	Java Basics - Anfänger-Themen	4	19. Feb 2022
T	String splitten	Java Basics - Anfänger-Themen	3	7. Feb 2022
	Schwimmen als Spiel. Problem mit to String/ generate a card	Java Basics - Anfänger-Themen	4	27. Jan 2022
J	Datentypen String in File konvertieren funktioniert nicht	Java Basics - Anfänger-Themen	4	22. Jan 2022
T	Platzhalter in String?	Java Basics - Anfänger-Themen	14	11. Jan 2022
M	String mit Variable vergleichen	Java Basics - Anfänger-Themen	9	23. Dez 2021
I	String Kombination erstellen anhand fortlaufender Zahl (Vertragsnummer)	Java Basics - Anfänger-Themen	13	4. Dez 2021
	Compiler-Fehler Kann ich einen String und die Summe zweier Char Werte mittels der println Anweisung ausgeben	Java Basics - Anfänger-Themen	4	3. Dez 2021
M	Wie kann eine Methode (string) eine andere Methode (void) mit zufälligen int-Werten aufrufen?	Java Basics - Anfänger-Themen	4	2. Dez 2021
	Vokale in einem String überprüfen mittels Rekursion	Java Basics - Anfänger-Themen	8	30. Nov 2021
	Strings und reguläre Ausdrücke - Methode mit return string.matches	Java Basics - Anfänger-Themen	5	30. Nov 2021
R	Ein Multidimensionales String Array initialisieren und Deklarieren	Java Basics - Anfänger-Themen	2	29. Nov 2021
H	String Repräsentation eines Rechtecks mit Instanz-Methode	Java Basics - Anfänger-Themen	8	27. Nov 2021
	Kartesisches Produkt von zwei Liste mit Hashmaps<String,String> erstellen	Java Basics - Anfänger-Themen	4	25. Nov 2021
S	String mit Int input vergleichen	Java Basics - Anfänger-Themen	5	23. Nov 2021
C	String/Char-API	Java Basics - Anfänger-Themen	13	21. Nov 2021
U	Char zu einem String machen	Java Basics - Anfänger-Themen	1	14. Nov 2021
B	Anzahl Nullen uns Einsen in String ermitteln	Java Basics - Anfänger-Themen	3	13. Nov 2021
T	Leerzeichen im String entfernen	Java Basics - Anfänger-Themen	6	11. Nov 2021
	Nullpointerexception bei Umwandlung von String zu int	Java Basics - Anfänger-Themen	2	9. Nov 2021
O	Ich habe einen String und soll mit matches schauen, ob ein Buchstabe zu einer geraden ANzahl im String vorkommt, wie soll das gehen?	Java Basics - Anfänger-Themen	7	6. Nov 2021
M	String beim einlesen formatieren	Java Basics - Anfänger-Themen	12	4. Nov 2021
N	null in String replacen	Java Basics - Anfänger-Themen	16	30. Okt 2021
R	Compiler-Fehler JTable mit XML befüllen \| The constructor JTable(Object[], String[]) is undefined	Java Basics - Anfänger-Themen	10	15. Okt 2021
M	Eclipse kennt keine String Klasse mehr	Java Basics - Anfänger-Themen	1	30. Sep 2021
M	Frage zur Methode split der Klasse String	Java Basics - Anfänger-Themen	32	28. Sep 2021
D	String mit int multiplizieren?	Java Basics - Anfänger-Themen	16	28. Sep 2021
H	Überprüfen ob String Array leer ist	Java Basics - Anfänger-Themen	4	5. Aug 2021
A	Korrigierte <String> Liste zurückgeben	Java Basics - Anfänger-Themen	22	22. Jul 2021
C	In String, Buchstaben ersetzen durch andere Buchstaben	Java Basics - Anfänger-Themen	26	16. Jul 2021
	String mit mehreren Wörtern füllen?	Java Basics - Anfänger-Themen	4	14. Jul 2021
I	String Expression mit Java validieren (true / false)	Java Basics - Anfänger-Themen	34	10. Jul 2021
B	String - Wörter finden, welches Punkt und entsprechender Pre / Suffix hat?	Java Basics - Anfänger-Themen	30	7. Jul 2021

String und Sonderzeichen

Guest

Gast

SlaterB

Gast

andre111

Bekanntes Mitglied

SlaterB

Gast

Guest

Gast

Gast

Gast

Ebenius

Top Contributor

Ähnliche Java Themen

Aktuelle Jobs

Neue Themen