HTTP Übersetzung yahoo babelfish - Zeichensatz-Problem

javatic

Mitglied
Halialo zusammen!

Ich beschäftige mich gerade ein wenig mit der Netzwerkprogrammierung und nutze als Übung den Übersetzer von Yahoo Babelfish. Diesem sende ich Parameter für die Übersetzung und lese die Ergebnis-HTML-Seite im Anschluss aus und parse den String so, dass nur noch die Übersetzung übrig bleibt und ich diese in eine JTextArea ausgeben kann.

Leider habe ich Problem bspw. mit Englisch - Griechisch, denn die griech. Buchstabem werden mir nicht angezeigt. Auch in der Eclipse Console werden Sie nicht angezeigt, obwohl alles auf UTF-8 gestellt ist.

Habe auch schon etwas in der Richtung hier probiert:
Java:
result = result.substring(begin, end); //Ergebnis filtern
		try {
			byte[] resultUTF = result.getBytes("UTF-8");
			result = new String(resultUTF, "UTF-8");
		} catch (UnsupportedEncodingException e) {
			e.printStackTrace();
		}
		
		return result; //Ergebnis zurückgeben

Nur leider führte dies auch zu keine Ergebnis.

Kann mir dabei jemand helfen? Danke!
 

bERt0r

Top Contributor
Ojeh, die Griechen schon wieder :D.
Spass beiseite, was heisst führt zu keinem Ergebnis? Wird eine Exception geworfen oder kommt einfach nix raus (leerer String)?
 

javatic

Mitglied
Es wird keine Exception geworden.

Im Textfeld ist ein String, weil wenn ich mit dem Mauszeiger die Inhalte markieren will, wird auch im Textfeld etwas markiert. Das wäre ja nicht der Fall, wenn nichts drin stehen würde. Allerdings sieht man halt nichts.

Irgendwie muss es dabei Probleme geben. Kann ja nur an der Codierung des Zeichensatzes liegen.
 

javatic

Mitglied
Habe mal ein Screenshot der ganzen Sache in den Anhang gemacht, wo verdeutlicht wird, was ich in meinem vorherigen Post meinte. Da ist einfach nichts zu sehen. Auch die Eclipse-Konsole zeigt keine Ergebnis an. Jedoch hat dieser String ja eine Länge, was man auf dem Bild sieht. Bei den anderen Sprachen funktioniert es auch, ausser halt bei denen, die so exotische Zeichen haben.

Grüße
 

javatic

Mitglied
Also ich habe jetzt noch einmal etwas gestöbert:

Das Firebug Tool für den FireFox zeigt mir als Ergebnis sowas hier an:
HTML:
<div id="result">
<div style="padding:0.6em;">Γειά σου</div>
</div>

In der Eclipse Konsole steht allerdings soetwas:
HTML:
<div id="result"><div style="padding:0.6em;">            </div></div>

Wenn ich probiere diesen Text aus der Konsole zu kopieren geht das auch gar nicht. Also irgendwie muss etwas mit der Kodierung nicht hinhauen. Komischerweise stehen im Head von der Babelfish-Seite auch zwei Charsets:

HTML:
<head>
<meta content="text/html; charset=UTF-8" http-equiv="content-type">
<title>Yahoo! Babel Fish - Text Übersetzung und Webseiten Übersetzung</title>
<meta content="Mit Yahoo! Babel Fish können Sie kostenlos Text und Webseiten übersetzen!" name="description">
<meta content="übersetzen, übersetzung, sprache, maschienen übersetzung, automatische übersetzung, babel fish, deutsch englisch, englisch, spanisch übersetzung" name="keywords">
<meta content="text/html; charset=UTF-8" http-equiv="content-type">
</head>

Die Umlaute in diesen MetaTags sehen in Eclipse auch eher kryptisch aus. Kästchen mit Fragezeichen drin. Jetzt vielleicht jemand einen Rat?
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
S Java-Frame <-> Yahoo's Babelfish Netzwerkprogrammierung 3

Ähnliche Java Themen

Neue Themen


Oben