Daten aus Website auslesen

Zapp_Branigan · 22. Mrz 2010

Ich würde gerne ein kleines Programm schreiben, dass dabei hilft komplette eBooks aus dem SpringerLink herunter zu laden nachdem unsere Bib einen Zugang gekauft hat.
Leider zerteilt Springer die eBooks in viele kleine Teile was es sehr aufwendig macht ein komplettes Buch herunterzuladen.
Beispiel: SpringerLink - Book

Mein erstes Problem ist gleich, dass ich es nicht schaffe die Seite überhaupt herunterzuladen.

Und danach schließt sich an, dass ich nicht weiß wie ich den HTML-Code auf bestimmte daten wie links oder den Buchtitel etc. durchsuchen kann. Irgendwie sowas wie zwischen „<h2 class="MPReader_Profiles_SpringerLink_Content_PrimitiveHeadingControlName">“ und „</h2>“ steht der Buchtitel aber bei den ganzen / dreht Java ja total durch... wie umgeht man dann sowas?

Ich bin überzeugt ihr könnt mir wie immer helfen

Onnur · 22. Mrz 2010

Reguläre Ausdrücke wäre ein Stichwort was dich weiterbringen sollte.

Zapp_Branigan · 22. Mrz 2010

Danke schon mal für den Hinweis werde ich mir anschauen, aber das Problem mit dem Abruf des Quellcodes der Seite als String ist ja noch offen...

Onnur · 22. Mrz 2010

BufferedReader, InputStreamReader und dann solange bis readLine null liefert auslesen bzw. anhängen.

Murray · 22. Mrz 2010

Oder auch mit dem HTTPClient

ARadauer · 22. Mrz 2010

oder mit hilfe von jtidy aus dem string einen dom baum erzeugen lassen und mit zb jdom darin navigieren...

Zapp_Branigan · 22. Mrz 2010

Könnt ihr mir da einen Beispielcode posten der bei der genannten Adresse funktioniert. Ich hatte schon mal folgendes probiert:

Java:

URL url = new URL("http://www.springerlink.com");
		    	//URL url = new URL("http://www.spiegel.de");
		        URLConnection connection = url.openConnection( );
		        InputStream is = connection.getInputStream( );
		        InputStreamReader isr = new InputStreamReader(is);
		        
		        BufferedReader br = new BufferedReader(isr);
		 
		        HTMLEditorKit htmlKit = new HTMLEditorKit( );
		        HTMLDocument htmlDoc = (HTMLDocument) htmlKit.createDefaultDocument( );
		        HTMLEditorKit.Parser parser = new ParserDelegator( );
		        HTMLEditorKit.ParserCallback callback = htmlDoc.getReader(0);
		        parser.parse(br, callback, true);

Geht aus irgendeinem Grund nicht sondern produziert eine Fehlermeldung. Bei Spiegel gehts. Ich habe keine Ahnugn woran das liegen kann...

Hier die Fehlermeldung:
java.io.IOException: Server returned HTTP response code: 403 for URL: SpringerLink Home - Main
at sun.net.www.protocol.http.HttpURLConnection.getInputStream(HttpURLConnection.java:1313)
at SPLD.main(SPLD.java:318)

Im Browser geht es natürlich und Spiegel.de geht auch.

Zapp_Branigan · 22. Mrz 2010

Kann man das hier vielleicht ins normale JAVA-Unterforum verschieben... ist vielleicht doch keine totale Anfängerfrage...

madboy · 22. Mrz 2010

HTTP 403 bedeuteut, dass der Server dir nicht erlaubt, die Daten zu lesen. Musst dich also authentifizieren. Meistens mittels Cookie, welcher bei der Anmeldung gesetzt wird. Spätestens jetzt würde ich dir raten, den Post bzw. den Link von Murray auf HTTPClient anzuschauen.

EDIT: ich denke, den Thread kann man ruhig im Anfängerforum lassen (google nach der Fehlermeldung hätte dir das mit der Authentifizierung auch gesagt) ;-)

EDIT nochmal: SpringerLink Home - Main leitet im Browser automatisch nach SpringerLink Home - Main um. Ersteres ist verboten, zweiteres lässt sich auch ohne Anmeldung lesen. Siehe auch HTTPClient, der kann automatische redirects.

Zapp_Branigan · 22. Mrz 2010

Also mit dem Tipp von Murray habe ich es wirklich hinbekommen die Seite abzurufen. Danke hierfür!

Murray · 23. Mrz 2010

madboy hat gesagt.:
EDIT nochmal: SpringerLink Home - Main leitet im Browser automatisch nach SpringerLink Home - Main um. Ersteres ist verboten, zweiteres lässt sich auch ohne Anmeldung lesen.

Das müsstest du nochmal etwas genauer ausführen - was genau ist warum verboten?

Empire Phoenix · 23. Mrz 2010

Nur am rande, oben rechts auf der site ist son mini button download this list..
Mangels anmeldedaten kann ichs nicht testen, aber downloaded der net dan alle?

Zapp_Branigan · 23. Mrz 2010

Ne der bietet einem dann nur an die Liste von Dokumenten als Excel oder txt herunterzuladen...

Zapp_Branigan · 23. Mrz 2010

Ich kämpfe gerade bisschen mit den Regulären ausdrücken. Habe mich versucht mich in der JavaInsel schlau zu lesen aber irgendwie bin ich zu doof.
Wie bekomme ich aus folgendem Beispiel das Ergebnis String s = "java-tutor.com\"

Java:

p = Pattern.compile( "<a href=.*>" ); 
Matcher m = p.matcher( "<a href=\"java-tutor.com\">" );

madboy · 23. Mrz 2010

Murray hat gesagt.:
Das müsstest du nochmal etwas genauer ausführen - was genau ist warum verboten?

Mit "verboten" meinte ich, dass ein Zugriff auf htt p://springerlink.com in einem HTTP 403 (forbidden) resultiert. Hat man automatische redirects aktiviert (wie im Browser oder mittels HTTPClient einstellbar), dann wird nach htt p://springerlink.com/home/main.mpx weiter geleitet, was kein 403 zur Folge hat.

madboy · 23. Mrz 2010

Zapp_Branigan hat gesagt.:
Ich kämpfe gerade bisschen mit den Regulären ausdrücken. Habe mich versucht mich in der JavaInsel schlau zu lesen aber irgendwie bin ich zu doof.
Wie bekomme ich aus folgendem Beispiel das Ergebnis String s = "java-tutor.com\"

Java:

p = Pattern.compile( "<a href=.*>" ); Matcher m = p.matcher( "<a href=\"java-tutor.com\">" );

Schau dir mal capturing groups an. Beispiel (evtl. nicht korrekt, nur kurz aus dem Kopf):

Java:

p = Pattern.compile( "<a href=(.*)>" ); 
Matcher m = p.matcher( "<a href=\"java-tutor.com\">" );
matcher.find();
String s = matcher.group(1); //Vorsicht, group(0) bedeutet kompletten Input oder ähnlich, daher group(1)

Zapp_Branigan · 23. Mrz 2010

Danke für die schnelle Antwort. Ich habe das ganze mal als:

Java:

Pattern p = Pattern.compile( "<a href=.*>" ); 
		Matcher m = p.matcher( "<a href=\"java-tutor.com\">" ); 
		
		m.find();
		String s = m.group(1);

interpretiert... aber es kommt "Exception in thread "main" java.lang.IndexOutOfBoundsException: No group 1"

:-(

madboy · 23. Mrz 2010

Du musst auch eine Gruppe definieren ;-)
Mit "normalen" Klammern, also (). Schau noch Mal genau auf meinen geposteten Code bei Pattern.compile

	Titel	Forum	Antworten	Datum
R	Daten von Applet an Website	Java Basics - Anfänger-Themen	4	16. Mai 2011
T	Unvollständige Daten in der TableView	Java Basics - Anfänger-Themen	8	4. Jul 2024
S	Daten aus Import Datei auslesen und sortieren	Java Basics - Anfänger-Themen	2	6. Nov 2023
A	Daten aus einer HashMap aus einer DB speichern und mit neuen Werten vergleichen	Java Basics - Anfänger-Themen	8	15. Mrz 2023
	Daten von JList & Combobox in JTable adden	Java Basics - Anfänger-Themen	2	10. Dez 2022
M	Daten aus errechneter Methode in Datenbank(SQLite) schreiben	Java Basics - Anfänger-Themen	60	4. Dez 2022
W	Daten in Echtzeit übernehmen	Java Basics - Anfänger-Themen	5	16. Nov 2022
Z	Java ArrayList speichert falsche Daten ab bzw. gibt falsche Daten aus?	Java Basics - Anfänger-Themen	42	12. Sep 2022
M	Daten aus .txt Datei einlesen und weiterverarbeiten	Java Basics - Anfänger-Themen	80	1. Sep 2022
I	H2 Datenbank starten / Daten in File speichern	Java Basics - Anfänger-Themen	25	2. Jul 2022
M	Mehrere Daten/ Variablen Speichern	Java Basics - Anfänger-Themen	9	11. Mrz 2022
E	fehlermeldung bei richtigen login daten	Java Basics - Anfänger-Themen	7	13. Jan 2022
C	Java Funktion: externe Daten vom Internet einbinden	Java Basics - Anfänger-Themen	2	6. Jan 2022
P	Schiebefix - ArrayList überschreibt Daten	Java Basics - Anfänger-Themen	3	14. Jun 2021
S	Daten/Klassen/Packages richtig updaten!?	Java Basics - Anfänger-Themen	2	28. Mai 2021
E	Wie gebe ich alle Daten zwischen zwei Zeitpunkten aus?	Java Basics - Anfänger-Themen	2	11. Jan 2021
H	Daten aus einer Datei in eine Liste speichern	Java Basics - Anfänger-Themen	23	21. Dez 2020
M	Tabellen- Daten laden	Java Basics - Anfänger-Themen	2	16. Sep 2020
A	Klasse um daten zu einlesen	Java Basics - Anfänger-Themen	26	27. Apr 2020
A	Literale für primitive Daten Typen	Java Basics - Anfänger-Themen	4	14. Mrz 2020
N	Zwei Daten (Datum) miteinander vergleichen, abspeichern, laden	Java Basics - Anfänger-Themen	4	17. Okt 2019
A	Daten auslesen/vergleichen	Java Basics - Anfänger-Themen	3	22. Aug 2019
D	Sportwetten Daten Atomatisch analysieren um optimale Strategie zu erhalten	Java Basics - Anfänger-Themen	6	11. Aug 2019
S	Java Daten in Excel speichern	Java Basics - Anfänger-Themen	1	4. Jun 2019
S	Daten speichern, ohne Datenbank	Java Basics - Anfänger-Themen	8	9. Mai 2019
L	Daten aus ArrayList in Datenbank durchsuchen	Java Basics - Anfänger-Themen	5	3. Mai 2019
	Daten speichern und ändern?	Java Basics - Anfänger-Themen	32	30. Mrz 2019
M	Sqlite table löschen und daten einfügen	Java Basics - Anfänger-Themen	5	28. Mrz 2019
S	Binäre-Suche bei unsortierten Daten	Java Basics - Anfänger-Themen	7	23. Mrz 2019
N	Was passiert wenn wir Daten auf der Festplatte abspeichern wollen? bzgl. BufferStreams	Java Basics - Anfänger-Themen	9	13. Jan 2019
T	Daten von Objekten speichern	Java Basics - Anfänger-Themen	7	9. Jan 2019
A	Minesweeper - Daten	Java Basics - Anfänger-Themen	46	1. Dez 2018
A	Eingelesene Daten in Array(Liste) abspeichern?	Java Basics - Anfänger-Themen	18	3. Nov 2018
S	Daten aus zwei Verschiedenen Tabellen in eine ArrayListe	Java Basics - Anfänger-Themen	4	29. Aug 2018
	Input/Output Wie aktiviere ich den Daten Transfer von der RS232 in meine Java Applikation	Java Basics - Anfänger-Themen	2	21. Aug 2018
R	Eigenes Protokoll zur Übermittlung von Daten zum Webserver?	Java Basics - Anfänger-Themen	4	9. Jun 2018
A	Reader wohin werden Daten gespeichert?	Java Basics - Anfänger-Themen	7	5. Jun 2018
M	Erste Schritte CSV-File einlesen und Daten verarbeiten	Java Basics - Anfänger-Themen	5	2. Jun 2018
S	Daten aus eigenständiger .class-Datei abrufen	Java Basics - Anfänger-Themen	1	25. Jan 2018
E	Daten dem Super Aufruf übergeben	Java Basics - Anfänger-Themen	3	4. Jan 2018
M	jTabel mit Daten Füllen	Java Basics - Anfänger-Themen	5	20. Dez 2017
M	Wie erzeuge ich die Differenz von zwei Daten in Stunden??	Java Basics - Anfänger-Themen	2	8. Dez 2017
S	Daten lesen und speichern	Java Basics - Anfänger-Themen	26	3. Dez 2017
S	JTable mit Daten füllen	Java Basics - Anfänger-Themen	7	28. Nov 2017
L	Java Programm zum Auswerten von Daten	Java Basics - Anfänger-Themen	11	31. Okt 2017
H	Passwortmanager, Sicherheit der Daten	Java Basics - Anfänger-Themen	12	21. Aug 2017
G	Best Practice Wie große "Tabellen" effizient durchsuchen und Daten händeln?	Java Basics - Anfänger-Themen	15	5. Jul 2017
U	Daten aus Datei einlesen	Java Basics - Anfänger-Themen	4	3. Jul 2017
M	Best Practice Daten-Import /Trabsfomration aus Textdatei	Java Basics - Anfänger-Themen	12	28. Jun 2017
R	JTable Suchfunktion mit SQL Daten	Java Basics - Anfänger-Themen	2	25. Jun 2017
E	Daten gehen nicht in Datenbank	Java Basics - Anfänger-Themen	14	18. Jun 2017
M	Erste Schritte Speichern von mehreren Daten	Java Basics - Anfänger-Themen	3	19. Apr 2017
J	Daten einer Textdatei in ein JTable importieren.	Java Basics - Anfänger-Themen	3	29. Mrz 2017
F	Daten von Thread an den aufrufenden zurückgeben	Java Basics - Anfänger-Themen	22	27. Mrz 2017
C	Endlosschleife bei füllen von Daten im JTable	Java Basics - Anfänger-Themen	5	25. Feb 2017
N	Erste Schritte Dedicated Server \ Senden und Empfangen von Daten/Befehlen	Java Basics - Anfänger-Themen	2	10. Feb 2017
A	Probleme beim zykl. aktulisieren von Daten in JTable	Java Basics - Anfänger-Themen	3	3. Feb 2017
D	NPE beim laden von Daten aus MySQL	Java Basics - Anfänger-Themen	9	29. Dez 2016
P	Einlesen von Daten via BufferedReader	Java Basics - Anfänger-Themen	4	4. Nov 2016
P	Methoden ausgelesene (CSV-) Daten in Liste einer anderen Klasse einlesen	Java Basics - Anfänger-Themen	0	22. Okt 2016
F	Daten aus Excel-Tabelle in Java importieren	Java Basics - Anfänger-Themen	15	19. Sep 2016
F	Http Post von mehreren Daten	Java Basics - Anfänger-Themen	5	2. Aug 2016
F	Daten auf Webserver laden - wiederholen bei Fehler	Java Basics - Anfänger-Themen	0	22. Jul 2016
W	Best Practice problemabhängige Persistentmachung von Daten	Java Basics - Anfänger-Themen	6	18. Jul 2016
P	Daten von Internetseite auslesen	Java Basics - Anfänger-Themen	10	1. Jul 2016
N	Daten/Formular per POST an Firefox/Browser senden	Java Basics - Anfänger-Themen	7	1. Jul 2016
D	Daten mit Apache POI in eine Excel Datei schreiben	Java Basics - Anfänger-Themen	5	12. Jun 2016
T	JTable Daten aus txt datei	Java Basics - Anfänger-Themen	3	29. Mai 2016
T	printf Daten aus der Tabelle in Excel übernehmen	Java Basics - Anfänger-Themen	5	4. Mai 2016
P	zweidimensionales Array anlegen und mit DB-Daten füllen	Java Basics - Anfänger-Themen	14	31. Mrz 2016
V	Einlesen von Daten	Java Basics - Anfänger-Themen	8	3. Jan 2016
J	TableView zeigt keine Daten an	Java Basics - Anfänger-Themen	14	29. Okt 2015
J	Daten im Programm speichern	Java Basics - Anfänger-Themen	14	22. Okt 2015
N	Interface Daten einem Implementierten Interface zuweisen	Java Basics - Anfänger-Themen	37	13. Okt 2015
O	Probleme mit CSV Daten	Java Basics - Anfänger-Themen	10	6. Okt 2015
M	Arrays: Trennung von Daten und Darstellung	Java Basics - Anfänger-Themen	1	15. Mai 2015
S	Daten aus Array in Klasse übertragen	Java Basics - Anfänger-Themen	12	12. Mai 2015
M	Wie sicher sind Daten im Java Programm?	Java Basics - Anfänger-Themen	9	12. Mai 2015
R	Daten via Post an php Script senden	Java Basics - Anfänger-Themen	1	8. Mai 2015
B	Probleme bei "Daten in CSV File schreiben".	Java Basics - Anfänger-Themen	9	5. Apr 2015
C	Datei mit Daten einlesen und höchsten wert der zweiten Spalte ermitteln	Java Basics - Anfänger-Themen	1	18. Dez 2014
W	(XML/XSL) Daten aus Eclipse in eine Klasse Laden.	Java Basics - Anfänger-Themen	1	25. Jul 2014
I	Daten speichern ohne Datenbank	Java Basics - Anfänger-Themen	20	24. Jul 2014
D	Daten von einem int in einen string	Java Basics - Anfänger-Themen	5	5. Jun 2014
L	Daten aus Array Feld löschen	Java Basics - Anfänger-Themen	2	2. Jun 2014
T	Input/Output Daten/Objekte einfach speichern	Java Basics - Anfänger-Themen	5	29. Mai 2014
	GUI mit Thread Daten austauschen.	Java Basics - Anfänger-Themen	6	22. Mai 2014
S	Daten aus anderen Dateien in neue Datei einlesen	Java Basics - Anfänger-Themen	3	20. Mai 2014
	Daten im selben Netzwerk an IP	Java Basics - Anfänger-Themen	1	25. Apr 2014
M	Junit Tests durchführen, die eine Verbindung zu einer Daten erfordern	Java Basics - Anfänger-Themen	3	13. Apr 2014
K	HashMap mit Daten aus ArrayList befüllen	Java Basics - Anfänger-Themen	14	11. Mrz 2014
P	Daten auslesen und in CSV speichern	Java Basics - Anfänger-Themen	6	11. Mrz 2014
J	Daten aus zweiter Klasse importieren	Java Basics - Anfänger-Themen	33	6. Mrz 2014
C	Daten speichern und laden	Java Basics - Anfänger-Themen	6	1. Mrz 2014
S	Je nach erhaltene Daten unterschiedlich reagieren (Design Pattern?)	Java Basics - Anfänger-Themen	3	22. Feb 2014
J	Daten von einer PHP Datei ablesen	Java Basics - Anfänger-Themen	1	20. Feb 2014
B	Klassen Zugriff auf Daten der Child-Klasse	Java Basics - Anfänger-Themen	9	20. Feb 2014
K	Daten (im Sinne von Datum) aus Webseiten extrahieren	Java Basics - Anfänger-Themen	6	16. Feb 2014
S	Erste Schritte Tage zwischen 2 Daten berechnen	Java Basics - Anfänger-Themen	6	15. Dez 2013
A	daten vom 1d array in 2d matrix speichern	Java Basics - Anfänger-Themen	3	9. Dez 2013

Daten aus Website auslesen

Zapp_Branigan

Aktives Mitglied

Onnur

Mitglied

Zapp_Branigan

Aktives Mitglied

Onnur

Mitglied

Murray

Top Contributor

ARadauer

Top Contributor

Zapp_Branigan

Aktives Mitglied

Zapp_Branigan

Aktives Mitglied

madboy

Top Contributor

Zapp_Branigan

Aktives Mitglied

Murray

Top Contributor

Empire Phoenix

Top Contributor

Zapp_Branigan

Aktives Mitglied

Zapp_Branigan

Aktives Mitglied

madboy

Top Contributor

madboy

Top Contributor

Zapp_Branigan

Aktives Mitglied

madboy

Top Contributor

Ähnliche Java Themen

Aktuelle Jobs

Neue Themen