Hallo,
Ich weiss nicht, ob ich das richitge Unterforum gewählt habe. Eigentlich hat mein Problem nicht direkt etwas mit Java zu tun, bzw ich weiss noch gar nicht, ob sich die gewünschte Funktionalität so in Java implementieren lässt. Es geht hier auch erstmal nicht unbedingt konkret um die Implementierung in Java (oder falls nötig auch einer anderen Sprache), sondern vielmehr um das Konzept.
Ich möchte folgendes erreichen:
Wann immer man einen Browser öffnet und eine website besucht, soll mein Programm (wenn es im Hintergrund läuft) den Seitenquelltext der aktuell im Browser aufgerufenen Seite in "Echtzeit" mitlesen.
Herauskommen soll mal ein tool, das einen bei aufwändigen Internetrecherchen unterstützen soll. Aber ich denke, fürs erste habe ich schon mit dieser Teilaufgabe genug zu tun.
Wichtig ist mir, dass alles vollkommen automatisch und für den Benutzer unsichtbar abläuft. Ein workaround, das zB darauf abzielt, dass der Benutzer manuell den Seitenquelltext anzeigen lässt, ihn dann in einer Textdatei speichert und durch mein Proggi laden lässt, käme also nicht in Frage.
Das ganze soll später einmal unter Windows mit dem IE und dem Firefox funktionieren.
Jetzt würde mich zuerst einmal ganz banal interessieren, welche Möglichkeiten man hat, so etwas zu erreichen?
Mir würden spontan folgende einfallen:
- Vom OS Speicherbereich des Browsers "erfragen", diesen auslesen und nach html durchsuchen. Dies müsste dann immer wieder nach einem bestimmten Zeitintervall geschehen.
(wäre meines Wissens nach nicht in Java möglich)
-Datenpakete direkt auf der Netzwerkschnittstelle mitlesen und html herausfiltern
(meiner Einschätzung nach die komplizierteste Vorgehensweise)
-Kann man die gängigen Browser irgendwie anweisen, eine aufgerufene Seite sofort bei Aufruf als Kopie irgendwo auf die Platte zu schreiben? Falls nicht, gibt es dann evtl. plugins die eine derartige Funktionalität zur Verfügung stellen?
(Sicherlich der sauberste Weg, kommt aber nur in Frage, wenn man es so hinbekommt, dass der Browser dies dann automatisch bei JEDER geladenen Seite SOFORT tut, ohne dass der Benutzer extra irgendwo draufklicken muss oder so)
Hat vielleicht noch jemand eine andere Idee, sowas zu realisieren? Was meint ihr zu den bereits vorgestellten Vorgehensweisen? Wie schon erwähnt, geht es zu allererst einmal nur um die Planung, nicht die konkrete Implementierung.
Wäre auch schon für ein paar Stichworte dankbar, in welche Richtung ich mich mal näher informieren sollte. Im Moment tappe ich noch vollkommen im Dunkeln.
MfG
MeisterGlanz
Ich weiss nicht, ob ich das richitge Unterforum gewählt habe. Eigentlich hat mein Problem nicht direkt etwas mit Java zu tun, bzw ich weiss noch gar nicht, ob sich die gewünschte Funktionalität so in Java implementieren lässt. Es geht hier auch erstmal nicht unbedingt konkret um die Implementierung in Java (oder falls nötig auch einer anderen Sprache), sondern vielmehr um das Konzept.
Ich möchte folgendes erreichen:
Wann immer man einen Browser öffnet und eine website besucht, soll mein Programm (wenn es im Hintergrund läuft) den Seitenquelltext der aktuell im Browser aufgerufenen Seite in "Echtzeit" mitlesen.
Herauskommen soll mal ein tool, das einen bei aufwändigen Internetrecherchen unterstützen soll. Aber ich denke, fürs erste habe ich schon mit dieser Teilaufgabe genug zu tun.
Wichtig ist mir, dass alles vollkommen automatisch und für den Benutzer unsichtbar abläuft. Ein workaround, das zB darauf abzielt, dass der Benutzer manuell den Seitenquelltext anzeigen lässt, ihn dann in einer Textdatei speichert und durch mein Proggi laden lässt, käme also nicht in Frage.
Das ganze soll später einmal unter Windows mit dem IE und dem Firefox funktionieren.
Jetzt würde mich zuerst einmal ganz banal interessieren, welche Möglichkeiten man hat, so etwas zu erreichen?
Mir würden spontan folgende einfallen:
- Vom OS Speicherbereich des Browsers "erfragen", diesen auslesen und nach html durchsuchen. Dies müsste dann immer wieder nach einem bestimmten Zeitintervall geschehen.
(wäre meines Wissens nach nicht in Java möglich)
-Datenpakete direkt auf der Netzwerkschnittstelle mitlesen und html herausfiltern
(meiner Einschätzung nach die komplizierteste Vorgehensweise)
-Kann man die gängigen Browser irgendwie anweisen, eine aufgerufene Seite sofort bei Aufruf als Kopie irgendwo auf die Platte zu schreiben? Falls nicht, gibt es dann evtl. plugins die eine derartige Funktionalität zur Verfügung stellen?
(Sicherlich der sauberste Weg, kommt aber nur in Frage, wenn man es so hinbekommt, dass der Browser dies dann automatisch bei JEDER geladenen Seite SOFORT tut, ohne dass der Benutzer extra irgendwo draufklicken muss oder so)
Hat vielleicht noch jemand eine andere Idee, sowas zu realisieren? Was meint ihr zu den bereits vorgestellten Vorgehensweisen? Wie schon erwähnt, geht es zu allererst einmal nur um die Planung, nicht die konkrete Implementierung.
Wäre auch schon für ein paar Stichworte dankbar, in welche Richtung ich mich mal näher informieren sollte. Im Moment tappe ich noch vollkommen im Dunkeln.
MfG
MeisterGlanz