Mit Java eine HTML-Seite speichern

Martin92 · 10. Apr 2012

Hallo,

ich will eine HTML-Seite aufrufen und diese speichern. Der genaue Link zu der Seite ist bekannt. Habt ihr irgendwelche Vorschläge, wie ich das am Besten machen kann?

Gruß
Martin

Camill · 10. Apr 2012

[JAPI]URL[/JAPI] und [JAPI]URLConnection[/JAPI] dürften da schon weiterhelfen.

Martin92 · 15. Apr 2012

Hallo,

danke für deine Antwort. Es klappt so. Nur jetzt habe ich ein anderes Problem: Ich kann den gesamten Quellcode der HTML-Seite nicht in einen String speichern. Ich brauche es um später mit regulären Ausdrücken etwas darin zu suchen.

Java:

URL myurl = new URL("http://www.google.de");
        URLConnection con = myurl.openConnection();
        Scanner scanner = new Scanner(myurl.openStream());
        
        
        String temp = "";
        while(scanner.hasNextLine()){
            temp.concat(scanner.nextLine());
        }
        
        System.out.println(temp);

Der String enthält keine Zeichen. Wo könnte der Fehler sein oder habe ich einen falschen Ansatz?

Marcinek · 15. Apr 2012

Strings sind unveränderlich.

temp.concat() gibt dir den konkatinierten String zurück.

Gast2 · 15. Apr 2012

Strings sind immutable. concat liefert einen neuen String zurück den du ignorierst. Nimm für sowas aber lieber nen StringBuilder.

Martin92 · 15. Apr 2012

Der enthält aber keine Zeichen. Darin liegt mein Problem.

[EDIT]ok, mache ich. deine antwort habe ich erst später gesehen.

danke, jetzt klappt es!

[/EDIT]

GUI-Programmer · 15. Apr 2012

Nun die Fortsetzung. Auf dieser Art und Weise lässt sich zwar der gesamte Quellcode (HTML) einer Website auslesen, allerdings, wenn man diesen dann anzeigen lässt im Browser, sind die ganzen Bilder weg - warum? Daher meine Frage: Gibt es eine bessere Möglichkeit? Oder warum erscheinen manche Dinge aus einer .html Datei anders als in der echten Website?

Code:

Java:

import java.net.URL;
import java.net.URLConnection;
import java.util.Scanner;
import java.io.BufferedWriter;
import java.io.FileWriter;
import java.io.File;

public class WebsiteSaver {
	public static void main(String[] args) throws Exception{
		if(args.length == 2) {
			URL url = new URL(args[0]);
			URLConnection con = url.openConnection();
			Scanner scanner = new Scanner(url.openStream());
			StringBuilder builder = new StringBuilder();
			while(scanner.hasNextLine()){
				builder.append(scanner.nextLine());
				builder.append(System.getProperty("line.separator"));
			}
			
			File file = new File(args[1]);
			file.createNewFile();
			BufferedWriter writer = new BufferedWriter(new FileWriter(file));
			writer.write(builder.toString());
			writer.flush();
			writer.close();
		}
	}
}

Test:

Code:

java WebsiteSaver [noparse]http://www.java-forum.org/[/noparse] JavaForum.html

L-ectron-X · 15. Apr 2012

GUI-Programmer hat gesagt.:
Daher meine Frage: Gibt es eine bessere Möglichkeit? Oder warum erscheinen manche Dinge aus einer .html Datei anders als in der echten Website?

Weil die URLs zu den Images in der Originalseite relativ notiert sind.
Wenn das Ganze auch bei dir lokal laufen soll. musst du die relative URL in absolute umwandeln, also noch das [noparse]http://www.java-forum.org/[/noparse] davor setzen.
Oder wenn du die Site rippen willst, auch die Images herunter laden und in gleichnamigen Verzeichnissen wie im Original ablegen.

GUI-Programmer · 15. Apr 2012

L-ectron-X hat gesagt.:
Wenn das Ganze auch bei dir lokal laufen soll. musst du die relative URL in absolute umwandeln, also noch das Java programmieren aus Leidenschaft davor setzen.

OK, doch woher weis ich, bei welchen src = ich das machen muss, denn schließlich kann es ja auch vorkommen, das die Bilder von einer anderen Website herstammen???
[EDIT]
Oh, mir ist beim Schreiben gerade aufgefallen, dass ich prüfen könnte, ob es nach src mit http: bzw. https, etc. weiter geht.
[/EDIT]

L-ectron-X · 15. Apr 2012

Siehste!

Geht mir auch oft so, dass ich beim "lauten" Nachdenken die Lösungen finde.

GUI-Programmer · 15. Apr 2012

So, hab jetzt schon eine Lösung:

Java:

import java.net.URL;
import java.util.Scanner;
import java.io.BufferedWriter;
import java.io.FileWriter;
import java.io.File;

public class WebsiteSaver {
	public static void main(String[] args) throws Exception{
		if(args.length == 2) {
			URL url = new URL(args[0]);
			url.openConnection();
			Scanner scanner = new Scanner(url.openStream());
			StringBuilder builder1 = new StringBuilder();
			while(scanner.hasNextLine()){
				builder1.append(scanner.nextLine());
				builder1.append(System.getProperty("line.separator"));
			}
			
			String text = builder1.toString();
			int index = -1;
			while((index = text.indexOf("src=", index+1)) != -1) {
				String value = text.substring(index+5, index+11);
				if(!value.contains("http:") && !value.contains("https:")) {
					StringBuilder builder2 = new StringBuilder();
					builder2.append(text.substring(0, index+5));
					builder2.append(args[0]);
					builder2.append(text.substring(index+5, text.length()-1));
					text = builder2.toString();
				}
			}
			
			
			File file = new File(args[1]);
			file.createNewFile();
			BufferedWriter writer = new BufferedWriter(new FileWriter(file));
			writer.write(text);
			writer.flush();
			writer.close();
		}
	}
}

Nun dazu noch eine Frage: Sollt ich noch nach etwas anderen außer "http" und "https" suchen? Bzw. gibts da noch was anderes???

GUI-Programmer · 15. Apr 2012

Ist wohl doch nicht so leicht, wie zuerst angenommen. Folgende Probleme gibt es noch zu lösen:

1. Dass sich die Pfade teilweise relativ zu "Haupt-Website" beziehen, und nicht zu der Page, von welchem man das Abbild möchte
2. Dass es unterschiedliche Art und Weisen gibt, wie man ein Bild relativ einbindet, sprich z.B einfach:

HTML:

src="images/Testbild.jpg"
src="/image/Tesbild.jpg"
src="../Testbild.jpg"

Vielleicht kann ja hier jemand weiterhelfen und evtl. meinen Code etw. modifizieren.

	Titel	Forum	Antworten	Datum
P	Java Object das eine HTML Datei repräsentiert	Java Basics - Anfänger-Themen	19	12. Mai 2011
3	Eine HTML Datei in eine Java Datei umschreiben	Java Basics - Anfänger-Themen	23	6. Sep 2010
N	Per Java in ein HTML-Suchfeld eine Variable reinschreiben	Java Basics - Anfänger-Themen	4	16. Dez 2008
T	Eine HTML Datei mit Java bear. Wie soll kann man anfangen?	Java Basics - Anfänger-Themen	11	28. Sep 2005
S	Java: Wie sortiere ich eine ArrayList benutzerdefinierter Objekte nach einem bestimmten Attribut?	Java Basics - Anfänger-Themen	2	31. Jul 2023
M	Datentypen While-Schleife eine Java Methode erstellen	Java Basics - Anfänger-Themen	3	21. Mrz 2023
P	Java Selenium . Parameterized.Parameters erzeugt eine Fehlermeldung	Java Basics - Anfänger-Themen	14	10. Jan 2023
A	Wie führe ich eine Batch-Datei von meiner Java-Anwendung aus?	Java Basics - Anfänger-Themen	18	15. Dez 2022
	Wie kann man in Java eine Zeichenformation ausgeben?	Java Basics - Anfänger-Themen	9	30. Okt 2022
	Singleton-Muster Java ->Nur eine Instanz einer Klasse erzeugen können	Java Basics - Anfänger-Themen	45	8. Jul 2022
	Findet eine parallele Verarbeitung in Java bei Threads erst statt, wenn man die Methoden auch synchronized? Und wie sieht bei Conditions aus?	Java Basics - Anfänger-Themen	8	24. Mai 2022
	Java ist auch eine Insel für Anfänger	Java Basics - Anfänger-Themen	2	12. Mrz 2022
	Java Fx, wie erstellt man einen EventHandler, der durch das Drücken eines Button Texte in eine Table view einfügt	Java Basics - Anfänger-Themen	17	9. Feb 2022
A	Wenn eine Zahl durch 7 teilbar ist, soll statt der Zahl ein ‘*‘ angezeigt werden. java?	Java Basics - Anfänger-Themen	47	7. Jan 2022
K	Präzedenregeln in Java sagen, dass +expr und -expr vor + von Addition und - von Addition stehen, warum wird dann z. B. a+b als eine Addition ausgeführ	Java Basics - Anfänger-Themen	7	12. Dez 2021
J	Alle .java Dateien von einem Verzeichnis in eine Zip speichern	Java Basics - Anfänger-Themen	2	16. Feb 2021
	Java - Eine oder mehrere Eingaben möglich machen	Java Basics - Anfänger-Themen	6	11. Jan 2021
C	Methoden Java ist auch eine Insel Listing 2.40 Recursion	Java Basics - Anfänger-Themen	7	8. Apr 2020
M	Wie kann ich eine Eingabe im Java-Swing übergeben?	Java Basics - Anfänger-Themen	1	20. Jun 2018
C	Java liest nur eine Zeile ein	Java Basics - Anfänger-Themen	3	17. Sep 2017
	Gibt es in der JAVA-API eine Funktion, die eine Dezimalzahl in eine binäre Zahl umwandelt?	Java Basics - Anfänger-Themen	8	10. Sep 2017
F	Erste Schritte Java ist auch eine Insel kaufen?	Java Basics - Anfänger-Themen	2	7. Apr 2017
B	Hilfe bei eine Java-Methode	Java Basics - Anfänger-Themen	4	28. Dez 2016
M	Erste Schritte Java prüfen ob eine der Möglichkeiten erfüllt ist	Java Basics - Anfänger-Themen	2	10. Nov 2016
W	Wie kann ich in Java eine Kurve aus Punkten zeichnen?	Java Basics - Anfänger-Themen	25	31. Aug 2016
1	Im Java Projekt eine txt datei einbinden?	Java Basics - Anfänger-Themen	8	14. Mrz 2015
A	Hat jemand einen ratschlag, wie java beim replaceALL eine geschweifte klammer erkennt ?	Java Basics - Anfänger-Themen	5	2. Feb 2015
D	Java erkennt eine deklarierte Variable nicht	Java Basics - Anfänger-Themen	2	2. Jan 2015
I	Java Eingabe aus einer anderen Klasse in eine andere an Konstruktor übergeben	Java Basics - Anfänger-Themen	4	26. Okt 2014
D	Türme von Hanoi in "Java ist auch eine Insel"	Java Basics - Anfänger-Themen	4	15. Sep 2014
J	für eine java klausur	Java Basics - Anfänger-Themen	5	7. Feb 2014
Y	Wie setze ich genau eine Stückliste (UML) in Java um?	Java Basics - Anfänger-Themen	9	13. Nov 2013
S	mit Java eine EXE im vordergrund ausführen	Java Basics - Anfänger-Themen	3	23. Jan 2013
N	Java UML: Eine Frage zu public-Variablen	Java Basics - Anfänger-Themen	19	22. Jan 2013
I	Variablen Wie initialisiert man in Java eine Variable ohne das Setzen von 0 oder einer anderen Zahl?	Java Basics - Anfänger-Themen	8	16. Nov 2012
	Frage zu Java ist auch eine Insel	Java Basics - Anfänger-Themen	12	30. Jul 2012
V	Mit JS eine JAVA Methode aufrufen	Java Basics - Anfänger-Themen	5	9. Jul 2012
B	Variablen Wie macht man eine call by reference mit primitiven Datentypen in Java?	Java Basics - Anfänger-Themen	2	27. Feb 2012
J	Geldberechner(aus Java ist auch eine Insel)	Java Basics - Anfänger-Themen	6	30. Aug 2011
G	Erste Schritte JAVA ist auch eine Insel	Java Basics - Anfänger-Themen	7	21. Jun 2011
A	Wie mit Java eine .vbs Datei starten lassen?	Java Basics - Anfänger-Themen	4	19. Jan 2011
A	Eine Frage zu AWt in JAVA, wie wähle ich ein Punkt aus`?	Java Basics - Anfänger-Themen	4	24. Okt 2010
M	Was ist genau eine Abstraktion in java	Java Basics - Anfänger-Themen	3	18. Feb 2010
H	Reflexion: Eine Methode, beliebig viele Parameter (Java 1.4.2)	Java Basics - Anfänger-Themen	8	5. Jan 2010
T	Java Webstart soll eine Datei speichern	Java Basics - Anfänger-Themen	2	7. Okt 2009
C	Aus Java eine Javascript Funktion aufrufen	Java Basics - Anfänger-Themen	14	28. Mai 2009
T	Frage aus dem Buch JAVA ist auch eine Insel	Java Basics - Anfänger-Themen	11	27. Dez 2008
M	Spielt der Debugger bei java eine große Rolle	Java Basics - Anfänger-Themen	3	6. Dez 2008
M	Aus wieviel Klassen darf in Java eine (Programm)besitzen?	Java Basics - Anfänger-Themen	21	28. Nov 2008
2	Mit Java in eine WORD-Datei schreiben	Java Basics - Anfänger-Themen	18	31. Okt 2008
X	Via Java auf eine Webseite einloggen.	Java Basics - Anfänger-Themen	6	18. Aug 2008
R	Java, Bluetooth: mit PC eine SPP Verbindung aufbauen	Java Basics - Anfänger-Themen	1	10. Jun 2008
	Wie startet man eine JAVA EE Projekt	Java Basics - Anfänger-Themen	22	28. Apr 2008
S	Codebeispiel aus Java ist auch eine Insel.	Java Basics - Anfänger-Themen	2	2. Apr 2008
J	Ein Java-Programm in eine *.exe Datei 'packen'	Java Basics - Anfänger-Themen	20	19. Mrz 2008
G	Eine HP mit Java läuft nicht	Java Basics - Anfänger-Themen	4	24. Jan 2008
J	Aus einem Java Programm eine .java datei Kompilieren	Java Basics - Anfänger-Themen	6	24. Dez 2007
G	Java Klasse durch eine andere Java Klasse starten?	Java Basics - Anfänger-Themen	13	8. Nov 2007
M	Java Quellcode in eine exe datei umwandeln	Java Basics - Anfänger-Themen	4	4. Nov 2007
W	Klasse in eine extra Java-Datei	Java Basics - Anfänger-Themen	21	20. Okt 2007
M	Mit Java eine neue DB anlegen über XAMPP? Ist das möglich ?	Java Basics - Anfänger-Themen	4	4. Okt 2007
V	Wie kann ich mit Java eine Tastatureingabe simmulieren ?	Java Basics - Anfänger-Themen	26	11. Sep 2007
	Mit Java eine Webpage schreiben	Java Basics - Anfänger-Themen	7	4. Jun 2007
P	mit Java auf eine PowerPoint-Präsentation zugreifen	Java Basics - Anfänger-Themen	3	26. Mrz 2007
M	Datenbankabfrage über eine Java Oberfläche	Java Basics - Anfänger-Themen	3	5. Feb 2007
C	eine dringende bitte an alle java-programmierer	Java Basics - Anfänger-Themen	4	31. Jan 2006
S	Daten in eine Variable in einem anderen Java File schreiben	Java Basics - Anfänger-Themen	10	25. Jan 2006
T	Newbie Frage Eine Java Anwendung fernsteuern?	Java Basics - Anfänger-Themen	4	6. Dez 2004
G	eine Frage zur Generic Java ?	Java Basics - Anfänger-Themen	8	27. Nov 2004
B	Mit Java eine Website "steuern"	Java Basics - Anfänger-Themen	18	2. Nov 2004
A	aus Java-Code eine jar-Datei ausführen	Java Basics - Anfänger-Themen	8	27. Jul 2004
T	Java ist auch eine Insel: Beispielprogramm fehlerhaft?	Java Basics - Anfänger-Themen	2	30. Jun 2004
G	Wie kann ich mit Java eine Textdatei auslesen?	Java Basics - Anfänger-Themen	20	19. Mrz 2004
B	Eine Linie zeichnenmit Java, ich verstehe das einfach nicht	Java Basics - Anfänger-Themen	4	23. Jan 2004
C	Aus Java eine Email wo der Body den Inhalt aus einer ....	Java Basics - Anfänger-Themen	6	4. Nov 2003
O	Erste Schritte Java Collections ohne synchronized gleichzeitig modifizieren?	Java Basics - Anfänger-Themen	8	18. Mai 2026
	Einfache Möglichkeit PDF in Java (Swing) anzuzeigen?	Java Basics - Anfänger-Themen	1	7. Mrz 2026
J	PDF-Datei in Java anzeigen	Java Basics - Anfänger-Themen	14	25. Feb 2026
D	Java 32Bit	Java Basics - Anfänger-Themen	45	17. Jan 2026
M	Java Programm/Schnittstelle aus unter Ordner in übergeordnetes java programmein binden	Java Basics - Anfänger-Themen	2	12. Jan 2026
A	Is not true check, in Java?	Java Basics - Anfänger-Themen	23	28. Dez 2025
	How to accurately calculate the number of days between two dates in Java?	Java Basics - Anfänger-Themen	32	22. Dez 2025
J	Java.exe mit seltsamen Verhalten	Java Basics - Anfänger-Themen	5	10. Nov 2025
M	HelloWorld.txt nach HelloWorld.java in Win11 funktioniert nicht	Java Basics - Anfänger-Themen	4	18. Aug 2025
	Java lässt sich auf älterem Win 7 nicht mehr installieren	Java Basics - Anfänger-Themen	34	3. Aug 2025
J	Probleme mit drucken aus Java	Java Basics - Anfänger-Themen	3	22. Mrz 2025
	Java chart library suggestion for web application?	Java Basics - Anfänger-Themen	2	18. Mrz 2025
D	wie kann ich gcc aus einer .java datei heraus aufrufen?	Java Basics - Anfänger-Themen	2	24. Dez 2024
S	Text Formatierung in Java	Java Basics - Anfänger-Themen	2	15. Dez 2024
B	Erste Schritte yaml parsen in Java	Java Basics - Anfänger-Themen	19	29. Nov 2024
C	Methoden Umlaute in Java	Java Basics - Anfänger-Themen	18	22. Nov 2024
W	Java-PRogramm liest als EXE-File Nicht USB, jedoch aus NetBeans	Java Basics - Anfänger-Themen	45	12. Nov 2024
W	Methoden java map ersatz für c++map	Java Basics - Anfänger-Themen	3	30. Okt 2024
M	Erste Schritte Java Primzahltester	Java Basics - Anfänger-Themen	4	28. Okt 2024
A	csv Reader für Java?	Java Basics - Anfänger-Themen	27	16. Okt 2024
K	Java - Enums	Java Basics - Anfänger-Themen	30	16. Okt 2024
	Java Unterstützung für exel dateien installieren.	Java Basics - Anfänger-Themen	2	13. Aug 2024
	java.lang.NoClassDefFoundError: org/json/JSONException	Java Basics - Anfänger-Themen	2	31. Jul 2024
	Mit Button andere java öffnen	Java Basics - Anfänger-Themen	4	19. Jul 2024
F	Java Object to Hashmap ?	Java Basics - Anfänger-Themen	6	26. Jun 2024

Mit Java eine HTML-Seite speichern

Martin92

Gast

Camill

Bekanntes Mitglied

Martin92

Gast

Marcinek

Gast

Gast2

Gast

Martin92

Gast

GUI-Programmer

Top Contributor

L-ectron-X

Gesperrter Benutzer

GUI-Programmer

Top Contributor

L-ectron-X

Gesperrter Benutzer

GUI-Programmer

Top Contributor

GUI-Programmer

Top Contributor

Ähnliche Java Themen

Aktuelle Jobs

Neue Themen