Daten aus Website auslesen

Zapp_Branigan

Aktives Mitglied
Ich würde gerne ein kleines Programm schreiben, dass dabei hilft komplette eBooks aus dem SpringerLink herunter zu laden nachdem unsere Bib einen Zugang gekauft hat.
Leider zerteilt Springer die eBooks in viele kleine Teile was es sehr aufwendig macht ein komplettes Buch herunterzuladen.
Beispiel: SpringerLink - Book

Mein erstes Problem ist gleich, dass ich es nicht schaffe die Seite überhaupt herunterzuladen.

Und danach schließt sich an, dass ich nicht weiß wie ich den HTML-Code auf bestimmte daten wie links oder den Buchtitel etc. durchsuchen kann. Irgendwie sowas wie zwischen „<h2 class="MPReader_Profiles_SpringerLink_Content_PrimitiveHeadingControlName">“ und „</h2>“ steht der Buchtitel aber bei den ganzen / dreht Java ja total durch... wie umgeht man dann sowas?

Ich bin überzeugt ihr könnt mir wie immer helfen :)
 

Zapp_Branigan

Aktives Mitglied
Könnt ihr mir da einen Beispielcode posten der bei der genannten Adresse funktioniert. Ich hatte schon mal folgendes probiert:
Java:
URL url = new URL("http://www.springerlink.com");
		    	//URL url = new URL("http://www.spiegel.de");
		        URLConnection connection = url.openConnection( );
		        InputStream is = connection.getInputStream( );
		        InputStreamReader isr = new InputStreamReader(is);
		        
		        BufferedReader br = new BufferedReader(isr);
		 
		        HTMLEditorKit htmlKit = new HTMLEditorKit( );
		        HTMLDocument htmlDoc = (HTMLDocument) htmlKit.createDefaultDocument( );
		        HTMLEditorKit.Parser parser = new ParserDelegator( );
		        HTMLEditorKit.ParserCallback callback = htmlDoc.getReader(0);
		        parser.parse(br, callback, true);
Geht aus irgendeinem Grund nicht sondern produziert eine Fehlermeldung. Bei Spiegel gehts. Ich habe keine Ahnugn woran das liegen kann...

Hier die Fehlermeldung:
java.io.IOException: Server returned HTTP response code: 403 for URL: SpringerLink Home - Main
at sun.net.www.protocol.http.HttpURLConnection.getInputStream(HttpURLConnection.java:1313)
at SPLD.main(SPLD.java:318)

Im Browser geht es natürlich und Spiegel.de geht auch.
 
Zuletzt bearbeitet:

madboy

Top Contributor
HTTP 403 bedeuteut, dass der Server dir nicht erlaubt, die Daten zu lesen. Musst dich also authentifizieren. Meistens mittels Cookie, welcher bei der Anmeldung gesetzt wird. Spätestens jetzt würde ich dir raten, den Post bzw. den Link von Murray auf HTTPClient anzuschauen.

EDIT: ich denke, den Thread kann man ruhig im Anfängerforum lassen (google nach der Fehlermeldung hätte dir das mit der Authentifizierung auch gesagt) ;-)

EDIT nochmal: SpringerLink Home - Main leitet im Browser automatisch nach SpringerLink Home - Main um. Ersteres ist verboten, zweiteres lässt sich auch ohne Anmeldung lesen. Siehe auch HTTPClient, der kann automatische redirects.
 
Zuletzt bearbeitet:

Empire Phoenix

Top Contributor
Nur am rande, oben rechts auf der site ist son mini button download this list..
Mangels anmeldedaten kann ichs nicht testen, aber downloaded der net dan alle?
 

Zapp_Branigan

Aktives Mitglied
Ich kämpfe gerade bisschen mit den Regulären ausdrücken. Habe mich versucht mich in der JavaInsel schlau zu lesen aber irgendwie bin ich zu doof.
Wie bekomme ich aus folgendem Beispiel das Ergebnis String s = "java-tutor.com\"
Java:
p = Pattern.compile( "<a href=.*>" ); 
Matcher m = p.matcher( "<a href=\"java-tutor.com\">" );
 

madboy

Top Contributor
Das müsstest du nochmal etwas genauer ausführen - was genau ist warum verboten?

Mit "verboten" meinte ich, dass ein Zugriff auf htt p://springerlink.com in einem HTTP 403 (forbidden) resultiert. Hat man automatische redirects aktiviert (wie im Browser oder mittels HTTPClient einstellbar), dann wird nach htt p://springerlink.com/home/main.mpx weiter geleitet, was kein 403 zur Folge hat.
 

madboy

Top Contributor
Ich kämpfe gerade bisschen mit den Regulären ausdrücken. Habe mich versucht mich in der JavaInsel schlau zu lesen aber irgendwie bin ich zu doof.
Wie bekomme ich aus folgendem Beispiel das Ergebnis String s = "java-tutor.com\"
Java:
p = Pattern.compile( "<a href=.*>" ); 
Matcher m = p.matcher( "<a href=\"java-tutor.com\">" );

Schau dir mal capturing groups an. Beispiel (evtl. nicht korrekt, nur kurz aus dem Kopf):

Java:
p = Pattern.compile( "<a href=(.*)>" ); 
Matcher m = p.matcher( "<a href=\"java-tutor.com\">" );
matcher.find();
String s = matcher.group(1); //Vorsicht, group(0) bedeutet kompletten Input oder ähnlich, daher group(1)
 

Zapp_Branigan

Aktives Mitglied
Danke für die schnelle Antwort. Ich habe das ganze mal als:
Java:
Pattern p = Pattern.compile( "<a href=.*>" ); 
		Matcher m = p.matcher( "<a href=\"java-tutor.com\">" ); 
		
		m.find();
		String s = m.group(1);
interpretiert... aber es kommt "Exception in thread "main" java.lang.IndexOutOfBoundsException: No group 1"

:-(
 

madboy

Top Contributor
Du musst auch eine Gruppe definieren ;-)
Mit "normalen" Klammern, also (). Schau noch Mal genau auf meinen geposteten Code bei Pattern.compile
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
R Daten von Applet an Website Java Basics - Anfänger-Themen 4
S Daten aus Import Datei auslesen und sortieren Java Basics - Anfänger-Themen 2
A Daten aus einer HashMap aus einer DB speichern und mit neuen Werten vergleichen Java Basics - Anfänger-Themen 8
Mady Daten von JList & Combobox in JTable adden Java Basics - Anfänger-Themen 2
M Daten aus errechneter Methode in Datenbank(SQLite) schreiben Java Basics - Anfänger-Themen 60
W Daten in Echtzeit übernehmen Java Basics - Anfänger-Themen 5
Z Java ArrayList speichert falsche Daten ab bzw. gibt falsche Daten aus? Java Basics - Anfänger-Themen 42
M Daten aus .txt Datei einlesen und weiterverarbeiten Java Basics - Anfänger-Themen 80
I H2 Datenbank starten / Daten in File speichern Java Basics - Anfänger-Themen 25
M Mehrere Daten/ Variablen Speichern Java Basics - Anfänger-Themen 9
E fehlermeldung bei richtigen login daten Java Basics - Anfänger-Themen 7
C Java Funktion: externe Daten vom Internet einbinden Java Basics - Anfänger-Themen 2
P Schiebefix - ArrayList überschreibt Daten Java Basics - Anfänger-Themen 3
S Daten/Klassen/Packages richtig updaten!? Java Basics - Anfänger-Themen 2
E Wie gebe ich alle Daten zwischen zwei Zeitpunkten aus? Java Basics - Anfänger-Themen 2
H Daten aus einer Datei in eine Liste speichern Java Basics - Anfänger-Themen 23
M Tabellen- Daten laden Java Basics - Anfänger-Themen 2
A Klasse um daten zu einlesen Java Basics - Anfänger-Themen 26
A Literale für primitive Daten Typen Java Basics - Anfänger-Themen 4
N Zwei Daten (Datum) miteinander vergleichen, abspeichern, laden Java Basics - Anfänger-Themen 4
A Daten auslesen/vergleichen Java Basics - Anfänger-Themen 3
D Sportwetten Daten Atomatisch analysieren um optimale Strategie zu erhalten Java Basics - Anfänger-Themen 6
S Java Daten in Excel speichern Java Basics - Anfänger-Themen 1
S Daten speichern, ohne Datenbank Java Basics - Anfänger-Themen 8
L Daten aus ArrayList in Datenbank durchsuchen Java Basics - Anfänger-Themen 5
Shallty Daten speichern und ändern? Java Basics - Anfänger-Themen 32
M Sqlite table löschen und daten einfügen Java Basics - Anfänger-Themen 5
S Binäre-Suche bei unsortierten Daten Java Basics - Anfänger-Themen 7
N Was passiert wenn wir Daten auf der Festplatte abspeichern wollen? bzgl. BufferStreams Java Basics - Anfänger-Themen 9
T Daten von Objekten speichern Java Basics - Anfänger-Themen 7
A Minesweeper - Daten Java Basics - Anfänger-Themen 46
A Eingelesene Daten in Array(Liste) abspeichern? Java Basics - Anfänger-Themen 18
S Daten aus zwei Verschiedenen Tabellen in eine ArrayListe Java Basics - Anfänger-Themen 4
WPS1000 Input/Output Wie aktiviere ich den Daten Transfer von der RS232 in meine Java Applikation Java Basics - Anfänger-Themen 2
R Eigenes Protokoll zur Übermittlung von Daten zum Webserver? Java Basics - Anfänger-Themen 4
A Reader wohin werden Daten gespeichert? Java Basics - Anfänger-Themen 7
M Erste Schritte CSV-File einlesen und Daten verarbeiten Java Basics - Anfänger-Themen 5
S Daten aus eigenständiger .class-Datei abrufen Java Basics - Anfänger-Themen 1
E Daten dem Super Aufruf übergeben Java Basics - Anfänger-Themen 3
M jTabel mit Daten Füllen Java Basics - Anfänger-Themen 5
M Wie erzeuge ich die Differenz von zwei Daten in Stunden?? Java Basics - Anfänger-Themen 2
S Daten lesen und speichern Java Basics - Anfänger-Themen 26
S JTable mit Daten füllen Java Basics - Anfänger-Themen 7
L Java Programm zum Auswerten von Daten Java Basics - Anfänger-Themen 11
H Passwortmanager, Sicherheit der Daten Java Basics - Anfänger-Themen 12
G Best Practice Wie große "Tabellen" effizient durchsuchen und Daten händeln? Java Basics - Anfänger-Themen 15
U Daten aus Datei einlesen Java Basics - Anfänger-Themen 4
M Best Practice Daten-Import /Trabsfomration aus Textdatei Java Basics - Anfänger-Themen 12
R JTable Suchfunktion mit SQL Daten Java Basics - Anfänger-Themen 2
E Daten gehen nicht in Datenbank Java Basics - Anfänger-Themen 14
M Erste Schritte Speichern von mehreren Daten Java Basics - Anfänger-Themen 3
J Daten einer Textdatei in ein JTable importieren. Java Basics - Anfänger-Themen 3
F Daten von Thread an den aufrufenden zurückgeben Java Basics - Anfänger-Themen 22
C Endlosschleife bei füllen von Daten im JTable Java Basics - Anfänger-Themen 5
N Erste Schritte Dedicated Server \ Senden und Empfangen von Daten/Befehlen Java Basics - Anfänger-Themen 2
A Probleme beim zykl. aktulisieren von Daten in JTable Java Basics - Anfänger-Themen 3
D NPE beim laden von Daten aus MySQL Java Basics - Anfänger-Themen 9
P Einlesen von Daten via BufferedReader Java Basics - Anfänger-Themen 4
P Methoden ausgelesene (CSV-) Daten in Liste einer anderen Klasse einlesen Java Basics - Anfänger-Themen 0
F Daten aus Excel-Tabelle in Java importieren Java Basics - Anfänger-Themen 15
F Http Post von mehreren Daten Java Basics - Anfänger-Themen 5
F Daten auf Webserver laden - wiederholen bei Fehler Java Basics - Anfänger-Themen 0
W Best Practice problemabhängige Persistentmachung von Daten Java Basics - Anfänger-Themen 6
P Daten von Internetseite auslesen Java Basics - Anfänger-Themen 10
N Daten/Formular per POST an Firefox/Browser senden Java Basics - Anfänger-Themen 7
D Daten mit Apache POI in eine Excel Datei schreiben Java Basics - Anfänger-Themen 5
T JTable Daten aus txt datei Java Basics - Anfänger-Themen 3
T printf Daten aus der Tabelle in Excel übernehmen Java Basics - Anfänger-Themen 5
P zweidimensionales Array anlegen und mit DB-Daten füllen Java Basics - Anfänger-Themen 14
V Einlesen von Daten Java Basics - Anfänger-Themen 8
J TableView zeigt keine Daten an Java Basics - Anfänger-Themen 14
J Daten im Programm speichern Java Basics - Anfänger-Themen 14
N Interface Daten einem Implementierten Interface zuweisen Java Basics - Anfänger-Themen 37
O Probleme mit CSV Daten Java Basics - Anfänger-Themen 10
M Arrays: Trennung von Daten und Darstellung Java Basics - Anfänger-Themen 1
S Daten aus Array in Klasse übertragen Java Basics - Anfänger-Themen 12
M Wie sicher sind Daten im Java Programm? Java Basics - Anfänger-Themen 9
R Daten via Post an php Script senden Java Basics - Anfänger-Themen 1
B Probleme bei "Daten in CSV File schreiben". Java Basics - Anfänger-Themen 9
C Datei mit Daten einlesen und höchsten wert der zweiten Spalte ermitteln Java Basics - Anfänger-Themen 1
W (XML/XSL) Daten aus Eclipse in eine Klasse Laden. Java Basics - Anfänger-Themen 1
I Daten speichern ohne Datenbank Java Basics - Anfänger-Themen 20
D Daten von einem int in einen string Java Basics - Anfänger-Themen 5
L Daten aus Array Feld löschen Java Basics - Anfänger-Themen 2
T Input/Output Daten/Objekte einfach speichern Java Basics - Anfänger-Themen 5
IngoF GUI mit Thread Daten austauschen. Java Basics - Anfänger-Themen 6
S Daten aus anderen Dateien in neue Datei einlesen Java Basics - Anfänger-Themen 3
fLooojava Daten im selben Netzwerk an IP Java Basics - Anfänger-Themen 1
M Junit Tests durchführen, die eine Verbindung zu einer Daten erfordern Java Basics - Anfänger-Themen 3
K HashMap mit Daten aus ArrayList befüllen Java Basics - Anfänger-Themen 14
P Daten auslesen und in CSV speichern Java Basics - Anfänger-Themen 6
J Daten aus zweiter Klasse importieren Java Basics - Anfänger-Themen 33
C Daten speichern und laden Java Basics - Anfänger-Themen 6
S Je nach erhaltene Daten unterschiedlich reagieren (Design Pattern?) Java Basics - Anfänger-Themen 3
J Daten von einer PHP Datei ablesen Java Basics - Anfänger-Themen 1
B Klassen Zugriff auf Daten der Child-Klasse Java Basics - Anfänger-Themen 9
K Daten (im Sinne von Datum) aus Webseiten extrahieren Java Basics - Anfänger-Themen 6
S Erste Schritte Tage zwischen 2 Daten berechnen Java Basics - Anfänger-Themen 6
A daten vom 1d array in 2d matrix speichern Java Basics - Anfänger-Themen 3
R csv-Datei auslesen und ausgelesene Daten in neue csv-Datei speichern Java Basics - Anfänger-Themen 2

Ähnliche Java Themen

Neue Themen


Oben