G
Guest
Gast
Hallo Leute,
ich möchte einen SEOAnalyser mit Java basteln.
Das heißt ich sende mit einem bestimmten Keyword eine Suchanfrage an eine Suchmaschine und verarbeite dann die Ergebnisse.
Das Problem ist das Senden der Suchanfrage:
Wenn ich das so ^^ mache, dann bekomme ich als Antwort stets ein Dokument mit einer ISO-8859-1 kodierung. Das kann ich nicht weiterverarbeiten. (Hab schon alles mögliche probiert, doch irgendwie damit zu arbeiten - seit 2 Tagen schon: das Resultat, es geht nicht...)
Wenn ich die Suchanfrage über einen HTTP Request löse, also so:
Dann bekomme ich ein Dokument, das immer die Startseite der Suchmaschine ist und nicht die Ergebnisseite.
Wie kann ich sonst so eine Suchanfrage mit Java realisieren? Bzw. warum antwortet die Suchmaschine mit einem ISO-8859-1 Dokument? Kann man da irgendwas drehen, dass das Dokument mit UTF-8 empfangen wird?
Bin für jegliche Hilfe sehr dankbar - sitz da schon seit 2 Tagen dran und langsam bin ich am verzweifeln.
Gruß Beni
ich möchte einen SEOAnalyser mit Java basteln.
Das heißt ich sende mit einem bestimmten Keyword eine Suchanfrage an eine Suchmaschine und verarbeite dann die Ergebnisse.
Das Problem ist das Senden der Suchanfrage:
Code:
URL url = new URL("http://de.search.yahoo.com/search?p=wunsch&fr=yfp-t-501&ei=UTF-8&meta=vl%3D");
BufferedReader in = new BufferedReader(new InputStreamReader(url.openStream(), "UTF-8"));
Wenn ich das so ^^ mache, dann bekomme ich als Antwort stets ein Dokument mit einer ISO-8859-1 kodierung. Das kann ich nicht weiterverarbeiten. (Hab schon alles mögliche probiert, doch irgendwie damit zu arbeiten - seit 2 Tagen schon: das Resultat, es geht nicht...)
Wenn ich die Suchanfrage über einen HTTP Request löse, also so:
Code:
URL url = new URL("http://de.search.yahoo.com:80/");
URLConnection conn = url.openConnection();
conn.setDoOutput(true);
OutputStreamWriter wr = new OutputStreamWriter(conn.getOutputStream(), "UTF-8");
wr.write("GET /search?p=wunsch&ei=UTF-8&fr=yfp-t-501&x=wrt&meta=vl%3D HTTP/1.0\r\n");
wr.write("Host: de.search.yahoo.com\r\n");
wr.write("Accept: text/html, text/plain, text/css, text/sgml, */*;q=0.01\r\n");
wr.write("Accept-Encoding: gzip\r\n");
wr.write("Accept-Language: en\r\n");
wr.write("User-Agent: Lynx/2.8.6rel.4 libwww-FM/2.14 SSL-MM/1.4.1 GNUTLS/1.6.2\r\n");
wr.write("\r\n");
wr.flush();
BufferedReader in = new BufferedReader(new InputStreamReader(conn.getInputStream()));
Wie kann ich sonst so eine Suchanfrage mit Java realisieren? Bzw. warum antwortet die Suchmaschine mit einem ISO-8859-1 Dokument? Kann man da irgendwas drehen, dass das Dokument mit UTF-8 empfangen wird?
Bin für jegliche Hilfe sehr dankbar - sitz da schon seit 2 Tagen dran und langsam bin ich am verzweifeln.
Gruß Beni