HTML code auslesen klappt nicht ganz

Status
Nicht offen für weitere Antworten.

Arp

Mitglied
Hi!

Ich versuche eine automatische quelltextauslesung zu programmieren.. habe dazu den quelltext von einem user hier verwendet der Wikipediaartikel auslesen wollte benutzt.

Der Code an sich funktioniert... nur krieg ich nicht die Seite die ich haben will, sondern die LogIn Seite.
Obwohl ich mit dem IE eingeloggt bin und den quelltext auslesen kann, werde ich bei der Anfrage mittels Java an die Login seite geschickt.

Hat jemand eine Idee wie man das lösen könnte?

Ich habe zwar eine Idee, aber die hat dann nichts mehr mit quelltexten zu tun..
Automatisierung des IE :)

per Java den IE igendwie scripten, so das er eine seite öffnet, quelltext speichert, nächste seite öffnet usw.
Nur hab ich da auch keine Ahnung wie man das realisieren kann.
thx :)

edit:
ich hab auch grad festgestellt das das nicht unbedingt an dem java code liegt, denn wenn ich den IE im command shell öffne und dahinter die URL anhänge, springt der auch automatisch zur login seite statt zur seite wo ich hin will.
 

Thammi

Aktives Mitglied
Hi,
du musst dich nicht mit dem IE einloggen sondern mit deinem Programm. Falls du in der URL eine Session-ID siehst (ziemlich lange Zeichenkette hinter der eigentlichen Adresse) kannst du die aber auch einfach in dein Programm übernehmen. Ansonsten musst du eben einen Login mit deinem Programm vortäuschen. Am besten eignet sich für so etwas übrigens der HTTP Client aus den Jakarta Commons.
Hab übrigens selber schon mit beiden Methoden auf Websites zugegriffen.

Hoffentlich hilft das weiter.
 

Arp

Mitglied
hmm, nein, das hilft ehrlich gesagt nicht weiter, denn es steht keine session ID da... und jakarta? :)

ich kann ja im IE den quelltext problemlaus auslesen... und dann steht in der URL leiste ja ne URL. Da dachte ich ich kann diese eifnach benutzen.
 

Thammi

Aktives Mitglied
Wahrscheinlich nutzt die Seite Cookies, also musst du dich wirklich direkt mit dem Programm einloggen. Dazu musst du die Werte per Post (oder Get, je nachdem was die Seite benutzt) so senden wie sie durch den Browser gesendet würden.
Um zu prüfen ob Cookies verwendet werden einfach mal beim Browser die Cookies deaktivieren.

Jakarta Commons HttpClient:
jakarta.apache.org/commons/httpclient/
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
C Gerenderte Website nach der ausführung von JavaScript als HTML Code aus lesen Netzwerkprogrammierung 4
D JavaMail: HTML Code einer Mail Netzwerkprogrammierung 9
M html Code darstellen Netzwerkprogrammierung 2
M Html Auslesen Netzwerkprogrammierung 6
D WebSocket Server mit HTML Client und Java Server Netzwerkprogrammierung 5
G seite nach posten eines html-forms laden Netzwerkprogrammierung 0
K HTTP Mit Java HTML Codeauslesen um damit zu arbeiten Netzwerkprogrammierung 7
B HTML mit Webserver und Datenbank verbinden Netzwerkprogrammierung 2
K Probleme bei HTML-Mail-Abruf mit IMAP bei 1und1 Netzwerkprogrammierung 2
Z HTTP HTML Element auslesen in Java Netzwerkprogrammierung 1
J Daten von einem HTML-Textfeld abrufen Netzwerkprogrammierung 3
J Json von Html request einlesen Netzwerkprogrammierung 0
X Einfach Server der HTML img Tags austauscht Netzwerkprogrammierung 1
P nanoHttp upload.html page lädt nicht Netzwerkprogrammierung 4
Xendarii HTTP Zeilenumbrüche aus HTML-Textarea entfernen Netzwerkprogrammierung 10
S HTML mit AJAX auslesen Netzwerkprogrammierung 2
Mike90 Mehspaltige HTML Tabelle parsen Netzwerkprogrammierung 3
S HTTP Ausgabe von Java-Inhalten in HTML Netzwerkprogrammierung 6
R HTTP Post HTML Netzwerkprogrammierung 5
Geese HTML Quelltext auslesen ergibt -null- Netzwerkprogrammierung 2
D HTTP html Bildreferenz in responseBody() schreiben Netzwerkprogrammierung 2
B HTTP HTML-Formular aus Java heraus befüllen und bedienen Netzwerkprogrammierung 3
I HTTP Post aus html in Java einlesen - Problem Netzwerkprogrammierung 2
I HTTP Post aus html in Java einlesen - Problem Netzwerkprogrammierung 6
R HTML in FileWriter schreiben Netzwerkprogrammierung 5
M Java-Programm als Webserver erzeugt HTML Netzwerkprogrammierung 8
U2nt Texte bzw. Attribute aus HTML etc. bekommen Netzwerkprogrammierung 2
B HTML meets Servlet Netzwerkprogrammierung 6
H HTTP Einloggen auf einer HTML (php) Seite Netzwerkprogrammierung 6
S redirected html auslesen Netzwerkprogrammierung 10
L Passwort + HTML und PHP Netzwerkprogrammierung 9
F Welchen HTML Parser soll ich nehmen? Netzwerkprogrammierung 3
B HTML Formularfelder erkennen und ausfüllen Netzwerkprogrammierung 3
A html - E-mail - Bilder Netzwerkprogrammierung 4
N HTML-Übertragung im lokalen Netzwerk mit Java - wie? Netzwerkprogrammierung 6
S Mittels Java XML abfragen und nicht die Ausgabe-HTML-Datei Netzwerkprogrammierung 5
H HTML-Mails mit JavaMail API Netzwerkprogrammierung 3
M Wie läd man eine HTML Seite in Java runter Netzwerkprogrammierung 2
Z HTML sent by doPost Netzwerkprogrammierung 2
T verbindung zu skript (wie html-formular) Netzwerkprogrammierung 2
M Quellcode einer HTML Seite erhalten Netzwerkprogrammierung 2
flashfactor Frage zu HTML-Response Netzwerkprogrammierung 4
T Html-Source über URL in einen String speichern? Netzwerkprogrammierung 16
G Java Chat mit HTML Cleint Netzwerkprogrammierung 3
C POST-Parameter aus HTML-Script lesen Netzwerkprogrammierung 1
C RMI Produzent-Verbraucher-Problem - Code review Netzwerkprogrammierung 12
A Chatserver/-client - Code stoppt bei readUTF() Netzwerkprogrammierung 7
B Java+Grbl: G-Code Befehle mit Java an Arduino senden und lesen Netzwerkprogrammierung 1
cezary Socket ServerSocket starten über GUIIm unterstehenden Code versuche Netzwerkprogrammierung 6
M RMI Code Frage: Netzwerkprogrammierung 4
R RMI Stub Code Netzwerkprogrammierung 2
H Socket Client server,verbindung läst sich nicht abbauen&code optimierung Netzwerkprogrammierung 3
W Socket Client ermitteln//Code inside Netzwerkprogrammierung 2
S RMI - dynamisch Code nachladen Netzwerkprogrammierung 5
V RMI: code wird einfach übergangen ? Netzwerkprogrammierung 3
M HTTP response code: 401 ; ?aber im browser ist es abrufbar? Netzwerkprogrammierung 5
A mein Code compiliert nicht! Netzwerkprogrammierung 2
bummerland Google liefert HTTP response code 403 Netzwerkprogrammierung 2
G Heimnetzwerkchatprogramm: Fehler im Code Netzwerkprogrammierung 11
R Code-Konvertierung bei Socket-Anbindung Netzwerkprogrammierung 1
x46 byte[] über BufferedReader auslesen Netzwerkprogrammierung 18
E Socket Parameter über Sockets übergeben und auslesen ! Netzwerkprogrammierung 5
J WLAN-Signalstärke in dbm auslesen Netzwerkprogrammierung 1
C IFrame mit java auslesen Netzwerkprogrammierung 1
DeathsGun Zeile von Streamcloud auslesen Netzwerkprogrammierung 1
D Webseite(mit JavaScript-Element) mit Java auslesen Netzwerkprogrammierung 0
J Webformular auslesen Netzwerkprogrammierung 2
D Einfache Verbindung zu Linux Server und Datei auslesen Netzwerkprogrammierung 13
B XMLRPC-Schnittstelle. Einzelne Felder aus dem Object auslesen Netzwerkprogrammierung 2
F Daten aus Internetseiten auslesen Netzwerkprogrammierung 56
precoc IP Auslesen Netzwerkprogrammierung 4
S HTTP Pakete Auslesen Netzwerkprogrammierung 22
B Authentifikation und anschliesendes auslesen von JSON Netzwerkprogrammierung 2
M lokale Benutzer auslesen Netzwerkprogrammierung 28
H Verzeichnis auf Server auslesen Netzwerkprogrammierung 13
S Bluetooth -Gerätename -Geräteadresse auslesen Netzwerkprogrammierung 4
M Proxy Einstellungen auslesen Netzwerkprogrammierung 2
B FTP Datei auslesen ohne einloggen möglich? Netzwerkprogrammierung 19
A HTTP Binärdaten über PHP-Skript in Datenbank schreiben bzw auslesen Netzwerkprogrammierung 2
N Systemeinstellung Proxyserver auslesen Netzwerkprogrammierung 2
V Quelltaxt einer Website auslesen funktioniert nicht Netzwerkprogrammierung 2
E HTTP Problem beim Auslesen von Websiten Netzwerkprogrammierung 6
M IP-Auslesen und ändern Netzwerkprogrammierung 25
B Globale IP-Adresse auslesen - Java Applet Netzwerkprogrammierung 2
S Port auf einer bestimmten IP-Adresse auslesen? Netzwerkprogrammierung 6
S website auslesen schlägt fehl Netzwerkprogrammierung 20
L Body eines http Request auslesen Netzwerkprogrammierung 2
P URL Parameter auslesen Netzwerkprogrammierung 5
G Kryptische Zeichen beim Auslesen einer Website Netzwerkprogrammierung 11
S Subnetzaddresse auslesen Netzwerkprogrammierung 34
F Timestamp aus IP-Header auslesen Netzwerkprogrammierung 2
L Größe einer Datei auslesen die im Netz liegt Netzwerkprogrammierung 4
S Mehrere Attachments mit JavaMail API auslesen Netzwerkprogrammierung 3
A SSL Zertifikat - modulus auslesen und vergleichen Netzwerkprogrammierung 1
F URL geordnet auslesen Netzwerkprogrammierung 3
E ordnerberechtigungen auslesen Netzwerkprogrammierung 2
P Textdateien aus Oracle-DB mittels Java auslesen und öffnen Netzwerkprogrammierung 7
G push clientseitig auslesen Netzwerkprogrammierung 5
D Daten, die mit PHP erzeugt werden, mit Java auslesen Netzwerkprogrammierung 8
C PCAP Datei auslesen Netzwerkprogrammierung 8

Ähnliche Java Themen

Neue Themen


Oben