Problem beim einlesen bestimmter Seiten

Status
Nicht offen für weitere Antworten.

CeNoRiDeR

Aktives Mitglied
Hallo zusammen,

kann mir einer sagen warum ich kein Ergebnis bekomme, wenn ich die Seite http:// www .amazon.de/gp/offer-listing/B00272NHOK/ über einen BufferedReader einlese. Ich habe mit gleichem Code schon tausende von Seiten eingelesen nur bestimmte seiten scheinen sich so nicht einlesen zu lassen. Weis einer warum?

Beispiel: http:// www . amazon . de geht einwandfrei einzulesen...



page = oben genannte URL

Java:
URL url = new URL(page);
str = (InputStream) url.getContent();
BufferedReader in = new BufferedReader(new InputStreamReader(str));

String line;
while ((line = in.readLine()) != null) {
   pageContent += line;
   System.out.println(line);
}
 
Zuletzt bearbeitet:
B

bygones

Gast
das eine ist eine statische seite bzw hat eine statische URL (amazon.de)

das andere ist eine generierte URL... das geht scheinbar dann nicht aehnlich http://www.trallala.de?show_page=45354

ja wie geil... www.trallala.de gibts wirklich :D

im Browser bekommst ne schoene seite... einlesen geht da net
 

CeNoRiDeR

Aktives Mitglied
das eine ist eine statische seite bzw hat eine statische URL (amazon.de)

das andere ist eine generierte URL... das geht scheinbar dann nicht aehnlich Trallala.de - Informationen zum Thema Promis.Diese Website steht zum Verkauf!

ja wie geil... Trallala.de - Informationen zum Thema Promis.Diese Website steht zum Verkauf! gibts wirklich :D

im Browser bekommst ne schoene seite... einlesen geht da net

Die URL kann aber scheinbar gefunden werden (es kommt zu keiner IO-Exception). Daher dürfte es doch egal sein ob ich per browser dran gehe, oder per programm (bufferedReader) !?

Wenn die die URL mit einem Spider-Viewer aufrufe, kommt auch die Page zurück. Und ein Spider-Viewer, muss ja intern auch die URL lesen....
 
Zuletzt bearbeitet:

musiKk

Top Contributor
Huh... Seit wann soll es denn eine Auswirkung haben, ob der Content dynamisch oder statisch ist (ich nehme jedenfalls an, das ist mit "dynamische URL" gemeint)? Das ist völlig egal. Es ist auch egal, ob du einen BufferedReader oder sonstwas verwendest, davon bekommt der Webserver ja nichts mit. Auf der Ebene des Betriebssystems sieht eh alles gleich aus (Sockets, blub). Der Grund ist bei sowas meist in der anderen Richtung; in diesem Fall bei HTTP. Manche Webserver wollen bestimmte Header. In diesem Fall reicht schon ein
Java:
conn.addRequestProperty("User-Agent", "firefox");
wobei [c]conn[/c] die URLConnection ist.
Könnte mir vorstellen, dass es hier daran liegt, dass triviale Versuche, die Seite zu parsen, unterbunden werden sollen und stattdessen Amazons API verwendet werden soll.
 

CeNoRiDeR

Aktives Mitglied
Huh... Seit wann soll es denn eine Auswirkung haben, ob der Content dynamisch oder statisch ist (ich nehme jedenfalls an, das ist mit "dynamische URL" gemeint)? Das ist völlig egal. Es ist auch egal, ob du einen BufferedReader oder sonstwas verwendest, davon bekommt der Webserver ja nichts mit. Auf der Ebene des Betriebssystems sieht eh alles gleich aus (Sockets, blub). Der Grund ist bei sowas meist in der anderen Richtung; in diesem Fall bei HTTP. Manche Webserver wollen bestimmte Header. In diesem Fall reicht schon ein
Java:
conn.addRequestProperty("User-Agent", "firefox");
wobei [c]conn[/c] die URLConnection ist.
Könnte mir vorstellen, dass es hier daran liegt, dass triviale Versuche, die Seite zu parsen, unterbunden werden sollen und stattdessen Amazons API verwendet werden soll.


schonmal vielen dank für die antwort! Meine vermutung geht in genau diese richtung.
Sobald ich später zeit habe werde ich das mal versuchen. (Die Amazon Api verwende ich. Sie liefert aber leider die gewünschte information nicht...)
 

CeNoRiDeR

Aktives Mitglied
Huh... Seit wann soll es denn eine Auswirkung haben, ob der Content dynamisch oder statisch ist (ich nehme jedenfalls an, das ist mit "dynamische URL" gemeint)? Das ist völlig egal. Es ist auch egal, ob du einen BufferedReader oder sonstwas verwendest, davon bekommt der Webserver ja nichts mit. Auf der Ebene des Betriebssystems sieht eh alles gleich aus (Sockets, blub). Der Grund ist bei sowas meist in der anderen Richtung; in diesem Fall bei HTTP. Manche Webserver wollen bestimmte Header. In diesem Fall reicht schon ein
Java:
conn.addRequestProperty("User-Agent", "firefox");
wobei [c]conn[/c] die URLConnection ist.
Könnte mir vorstellen, dass es hier daran liegt, dass triviale Versuche, die Seite zu parsen, unterbunden werden sollen und stattdessen Amazons API verwendet werden soll.


TOP! genau das war es...
Danke nochmal :)
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
F Problem beim Einlesen einer Textdatei Allgemeine Java-Themen 12
S Problem beim Einlesen von byte-werten aus datei Allgemeine Java-Themen 2
8u3631984 Problem beim Mocken von Record Klassen Allgemeine Java-Themen 4
stormyark Problem beim Klassen erstellen Allgemeine Java-Themen 1
G javamail Problem beim Empfangen von Nachrichten Allgemeine Java-Themen 3
T Problem beim Umwandeln in eine Jar-Datei Allgemeine Java-Themen 3
J Problem beim Umstellen auf Java jdk 13 Allgemeine Java-Themen 3
A Problem beim öffnen von Java-Installern Allgemeine Java-Themen 1
J Problem beim Generischen Klassen und Interfaces Allgemeine Java-Themen 2
G Problem beim GUI Allgemeine Java-Themen 9
A OOP Problem beim Berechnen der größten Fläche eines Ringes Allgemeine Java-Themen 19
I Problem beim Aufrufen, von Objektmethoden/ -variablen Allgemeine Java-Themen 6
D Selenium WebDriver HtmlUnitDriver Problem beim Automatisieren Allgemeine Java-Themen 1
F Problem beim Speichern eines Attachments Allgemeine Java-Themen 3
M Problem beim Starten der Anwendung Allgemeine Java-Themen 3
O Problem beim Auslesen einer Arraylist von JComboBoxen Allgemeine Java-Themen 2
GUI-Programmer JNI - Problem beim Erstellen der .dll Allgemeine Java-Themen 9
D Problem mit Referenzen beim Serialisieren Allgemeine Java-Themen 3
R Problem beim vCard Manipulieren Allgemeine Java-Themen 2
Rudolf Problem beim Visitorpattern Allgemeine Java-Themen 2
J Problem beim Auslesen einer Datei vom Server Allgemeine Java-Themen 4
M Problem beim schreiben einer eigene generische Klasse Hashtable Allgemeine Java-Themen 11
U Mailclient über getDesktop.mail vorbereiten, Problem beim Anhang: Allgemeine Java-Themen 3
M Problem beim schreiben einer eigene generische Klasse LinkedList Allgemeine Java-Themen 34
N Problem beim lesen einer File in JAR-File Allgemeine Java-Themen 3
N iText Problem beim verlinken anderer PDFs Allgemeine Java-Themen 2
M Problem beim Drucken von PDFs Allgemeine Java-Themen 3
H Problem beim Sortieren einer HashMap mit TreeSet Allgemeine Java-Themen 4
I Problem beim Ausführen von Shell Commandos Allgemeine Java-Themen 3
O Problem beim Ausgeben von Arrays Allgemeine Java-Themen 9
L Problem beim animieren von Bildern in Applet Allgemeine Java-Themen 23
Apo JNI-Problem beim erneuten Laden einer dll Allgemeine Java-Themen 28
S Problem beim Drucken auf Netzwerkdrucker unter Linux Allgemeine Java-Themen 9
S Problem beim Anlegen eines JDialogs! Allgemeine Java-Themen 4
A Problem mit ShutdownHook beim schließen Allgemeine Java-Themen 7
S Problem beim Löschen des Inhalts des Fensters Allgemeine Java-Themen 4
A Problem beim serialisieren/deserialisieren einer ArrayList Allgemeine Java-Themen 3
M Problem beim Umrechnen von Pixel in cm. Allgemeine Java-Themen 6
M Problem beim ausführen von Batchdateien Allgemeine Java-Themen 21
Escorter Problem beim starten von Batchfiles Allgemeine Java-Themen 4
A Problem beim Starten der H2-Datenbank Allgemeine Java-Themen 4
L WindowsTrayIcon in Java 1.4 - Problem beim ausführen der JAR Allgemeine Java-Themen 2
E Problem beim Anlegen einer Datei Allgemeine Java-Themen 4
E Problem beim Dateien kodieren ("Byte = Byte +1") Allgemeine Java-Themen 3
G Problem beim starten von eclipse product Allgemeine Java-Themen 2
M Problem beim Erstellen eines Objektes Allgemeine Java-Themen 3
M Problem beim laden von vielen Bildern Allgemeine Java-Themen 16
H Problem beim Malen auf ein Panel Allgemeine Java-Themen 2
G iText: Problem beim Drucken von AcroFormen Allgemeine Java-Themen 2
E Problem beim fertigen Programm die Hintergrundfarbe ändern Allgemeine Java-Themen 8
karambara Sonderzeichen-Problem beim Lesen und Speichern von Dateien Allgemeine Java-Themen 6
R Problem beim Datentransfer Allgemeine Java-Themen 19
C Problem beim Umstieg von Java1.4 auf 1.5 Allgemeine Java-Themen 5
K javax.comm Problem beim starten aus .jar heraus Allgemeine Java-Themen 3
S Problem beim Bearbeiten von Java-Dateien unter Linux Allgemeine Java-Themen 3
S Hab ein Problem! Bei Dame! Beim Umranden! Allgemeine Java-Themen 2
G Problem beim speichern von Dateien Allgemeine Java-Themen 8
M Problem mit PageFormat beim Drucken Allgemeine Java-Themen 2
Streeber Problem beim Kompilieren und Ausführen Allgemeine Java-Themen 20
E Problem beim Compilieren Allgemeine Java-Themen 6
O JNI Problem beim kompilieren Allgemeine Java-Themen 2
M Codepage Problem (Vertauscht Zeichen beim Lesen aus Datei) Allgemeine Java-Themen 3
P Problem beim "spliten" eine Textdatei Allgemeine Java-Themen 3
F Problem beim Drucken mit javax.print Allgemeine Java-Themen 2
Z Problem beim Aufruf eines Listener? Allgemeine Java-Themen 4
bernd Problem beim kopieren! Allgemeine Java-Themen 2
B problem beim erstellen einer ausführbaren jar-datei Allgemeine Java-Themen 5
A Problem beim Aufruf von javac Allgemeine Java-Themen 7
J JFrame Problem beim schließen Allgemeine Java-Themen 2
S Problem beim Zugriff auf Internetseiten Allgemeine Java-Themen 4
R Problem beim speichern von eigenem objekt Allgemeine Java-Themen 6
krgewb Problem mit Umlauten und Eszett bei InputStream Allgemeine Java-Themen 3
Max246Sch Backtracking Problem Box Filler Allgemeine Java-Themen 6
NightVision402 VisualVM Startskript Problem Allgemeine Java-Themen 3
javaBoon86 Email Server Connection Problem Allgemeine Java-Themen 1
F Problem mit PDFBOX Library Allgemeine Java-Themen 1
A Java modul Problem Allgemeine Java-Themen 4
D Read JSON File Problem Allgemeine Java-Themen 9
urmelausdemeis Exception in thread "main" java.lang.Error: Unresolved compilation problem: Allgemeine Java-Themen 7
J Problem mit JasperReports Allgemeine Java-Themen 8
M log4j Problem mit jlink Allgemeine Java-Themen 19
torresbig Website login Problem - Jsoup, wie bisher, klappt nicht! Allgemeine Java-Themen 31
P Selenium . getText Problem Allgemeine Java-Themen 9
A Jar zu Exe Problem Allgemeine Java-Themen 13
sserio Variablen Liste erstellt und ein Problem mit dem Index Allgemeine Java-Themen 6
S Folgendes Problem bei einem Programm Allgemeine Java-Themen 1
A Thread.sleep Problem Allgemeine Java-Themen 2
A Problem bei der Nachbarschafttest Allgemeine Java-Themen 11
Splayfer Problem: no main manifest attribute Allgemeine Java-Themen 3
Splayfer JDA Problem mit MessageCounter Allgemeine Java-Themen 0
Splayfer Problem mit BufferedWriter Allgemeine Java-Themen 3
F Streams als Alternative für dieses Problem ? Allgemeine Java-Themen 15
N Maven Problem mit Datenbanktreiber (H2 Embedded) Allgemeine Java-Themen 12
B Einfach Elemente zweier Arraylisten kreuz und quer vergleichen, min und max Problem? Allgemeine Java-Themen 16
C ArrayList Problem Allgemeine Java-Themen 3
kev34 nim-Spiel problem Allgemeine Java-Themen 1
D Firebase retrieve data Problem, Child Element wird nicht angesprochen Allgemeine Java-Themen 0
G Welches Problem besteht bei den Typparametern? Allgemeine Java-Themen 5
temi Problem mit Aufrufreihenfolge bei Vererbung Allgemeine Java-Themen 3
Sumo_ow "ArrayIndexOutofBoundsException: 2" Array Problem Allgemeine Java-Themen 6

Ähnliche Java Themen

Neue Themen


Oben