Hallo!
Ich lese mit diesem Codeschnipsel Webseiten aus:
Durch die Angabe der ISO-8859-1 Codierung werden natürlich UTF-8 codierte Seiten falsch dargestellt. Wenn ich die Angabe der Codierung weglasse, werden manche Seiten ebenfalls falsch dargestellt. Deshalb meine Frage: Gibt es irgendeine Möglichkeit vorab die Codierung zu checken oder einen Weg, den ausgelesenen Text richtig darzustellen?
Ich lese mit diesem Codeschnipsel Webseiten aus:
Java:
url = new URL(site);
BufferedReader website = new BufferedReader(new InputStreamReader(url.openStream(), "ISO-8859-1"));
for (String s; (s=website.readLine()) != null;)
data += s;