Ich schreibe gerade ein Java Programm, in dem ich (wegen der immer noch nicht bereitgestellten API) auf den HTML-Text einer Webseite zugreifen möchte. Wie man das normalerweise macht, ist mir klar. Das Problem ist nur, dass diese Seite sich nicht automatisch auslesen lässt. Wenn ich die URL aus meinem Java-Programm öffne, bekomme ich nur ein "Client refused" zurückgeliefert (bei anderen URLs funktioniert es dagegen fehlerfrei). Rufe ich die besagte URL über meinen Webbrowser auf, wird sie aber richtig angezeigt.
Kann ich das irgendwie umgehen? Was zum Beispiel funktioniert, ist ein Konsolenaufruf aus dem Java-Programm heraus, welches die Seite automatisch im Browser öffnet.
Jetzt ist meine Frage, ob ich von dort irgendwie den Quellcode automatisch in meinem Java-Programm auslesen lassen kann. Aus dem Browser exportieren? Oder kann ich den HTML-Code auf der Console anzeigen lassen und von dort auslesen. Oder kann ich es gar auf einem anderen Wege umgehen?
Ich hoffe meine Frage ist nicht zu speziell und jemand hilft mir weiter - ich wäre sehr dankbar.
Kann ich das irgendwie umgehen? Was zum Beispiel funktioniert, ist ein Konsolenaufruf aus dem Java-Programm heraus, welches die Seite automatisch im Browser öffnet.
Java:
Runtime.getRuntime().exec("open http://www.google.de");
Jetzt ist meine Frage, ob ich von dort irgendwie den Quellcode automatisch in meinem Java-Programm auslesen lassen kann. Aus dem Browser exportieren? Oder kann ich den HTML-Code auf der Console anzeigen lassen und von dort auslesen. Oder kann ich es gar auf einem anderen Wege umgehen?
Ich hoffe meine Frage ist nicht zu speziell und jemand hilft mir weiter - ich wäre sehr dankbar.
Zuletzt bearbeitet: