Html Parsen / Values von Hidden Fields auslesen

Status
Nicht offen für weitere Antworten.
M

Michi2007

Gast
Hi

ich versuch mit grad bisschen an Java und hab so eine Htmldatei als Quelle:


Code:
...
<input type="hidden" name="abc" value="xyz">
...

Nun möchte ich das xyz auslesen, weiss aber nicht genau, wie ich das anstellen soll.

Ich benutze den htmlparser, aber komm damit nicht klar, Anfänger halt :)

Bin im Moment an der Stelle:

Code:
NodeList list = parser.parse (null);


Jetzt komm ich allerdings nichtmehr weiter. Bin ich da überhaupt auf dem richtigem Weg?

Wäre cool, wenn mir jemand helfen könnte :wink:
 

André Uhres

Top Contributor
Michi2007 hat gesagt.:
..hab so eine Htmldatei als Quelle:
Code:
...
<input type="hidden" name="abc" value="xyz">
...
Nun möchte ich das xyz auslesen..
Eine Möglichkeit wäre:
Code:
package html;
/*
 * ParseHtml.java
 */
import java.io.*;
import java.net.*;
import java.util.regex.*;
import org.htmlparser.*;
import org.htmlparser.lexer.*;
import org.htmlparser.util.*;
public class ParseHtml {
    private URL url;
    private URLConnection con;
    private Lexer lexer;
    private String resultString;
    public ParseHtml() {
        try {
            test();
        } catch (Exception ex) {
            ex.printStackTrace();
        }
    }
    private void test()throws Exception{
        url = new URL("http://www.java-forum.org/de/userfiles/user3690/meins.html");
        con = url.openConnection();
        lexer = new Lexer(con);
        while(true){
            Node node = lexer.nextNode();
            if(node == null)break;
            String nodeText = node.getText().trim();
            if(nodeText.equals("")) continue;
            System.out.println(nodeText);
            if(nodeText.matches("(?i).*input.+type.+hidden.*")){
                Pattern regex = Pattern.compile("(?i).*(?<=value {0,20}= {0,20}\")(.*)(?=\")");
                Matcher matcher = regex.matcher(nodeText);
                if (matcher.find())
                    resultString = matcher.group(1);
            }
        }
        System.out.println("\n**********************************************");
        System.out.println("Aus obigem Text wurde folgender Wert ermittelt: "+resultString);
    }
    public static void main(final String[] args) {new ParseHtml();}
}
 
M

Michi2007

Gast
ah sehr gut danke ich werds gleich mal testen!

Ist es auch noch möglich an die Seite, die geparst wird, Daten per POST zu übergeben?
 

Leroy42

Top Contributor
Michi2007 hat gesagt.:
Ist es auch noch möglich an die Seite, die geparst wird, Daten per POST zu übergeben?

Was verstehst du unter Daten an eine Seite übergeben? :shock:

Meinst du ähnlich wie es der Browser macht?
 
M

Michi2007

Gast
hi nach längerer zeit meld ich mcih dann mla wieder.

ja mit post übergeben mein ich einfach genauso wie wenn man ein formular mit method=post absenden würde
 

HoaX

Top Contributor
für sowas nimmste am besten httpclient von apache, oder darauf aufbauend und besser zum aufrufen/parsen/füllen/absenden/testen/... von webseiten htmlunit/httpunit.
 
G

Guest

Gast
Danke für den Tipp mit dem htmlunit, das funzt jetzt fast perfekt, ein Problem bleiben die Cookies.

Wie schaffe ich es, dass die Cookies "akzeptiert" werden(es steht in der Konsole immer Cookie rejected), also dass wenn ich ne Seite öffnen nicht kommt, dass man Cookies aktivieren soll (ja scheisse ausgedrückt, ich weiss :D ).

Es heisst, der Cookie Handlre von hier
jakarta.apache.org/commons/httpclient/cookies.html
wird benutzt, was das genau bedeutet weiss ich leider nicht. Brauche also Hilfe :wink:

So öffne ich die Seite:

Code:
		URL url = new URL("http://www.seite.de");
		WebClient seite = new WebClient();
		HtmlPage read = (HtmlPage) seite.getPage(url);
[/code]
 
G

Guest

Gast
Danke für den Tipp mit dem htmlunit, das funzt jetzt fast perfekt, ein Problem bleiben die Cookies.

Wie schaffe ich es, dass die Cookies "akzeptiert" werden(es steht in der Konsole immer Cookie rejected), also dass wenn ich ne Seite öffnen nicht kommt, dass man Cookies aktivieren soll (ja scheisse ausgedrückt, ich weiss :D ).

Es heisst, der Cookie Handlre von hier
jakarta.apache.org/commons/httpclient/cookies.html
wird benutzt, was das genau bedeutet weiss ich leider nicht. Brauche also Hilfe :wink:

So öffne ich die Seite:

Code:
		URL url = new URL("http://www.seite.de");
		WebClient seite = new WebClient();
		HtmlPage read = (HtmlPage) seite.getPage(url);
[/code]
 

Drake

Bekanntes Mitglied
Hmm

auf der Seite die du anführst steht doch ganz genau beschrieben wie du den HttpClient dazu bringst Cookies zu managen.

mfg
Drake
 
M

Michi2007

Gast
jo ich weiss, da ich aber allerings ein totaler anfänger bin, weiss ich nicht genau wie ich das anpacken soll :mad::confused:

Auf der Seite steht man muss es so machen:
Code:
HttpMethod method = new GetMethod();
method.getParams().setCookiePolicy(CookiePolicy.RFC_2109);

und ich hab jetzt das wie gesagt:

Code:
URL url = new URL("http://www.seite.de");
WebClient seite = new WebClient();
 HtmlPage read = (HtmlPage) seite.getPage(url);

müsste ich in meinem fall jetzt

read.getParams().setCookiePolicy(CookiePolicy.RFC_2109);

schreiben?
 

Drake

Bekanntes Mitglied
Hallo

da ich weder deine Klasse WebClient noch HtmlPage kenne kann ich dir dazu nicht sagen
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
V Umlaute beim Parsen einer HTML Seite Java Basics - Anfänger-Themen 4
J HTML mit XPath parsen Java Basics - Anfänger-Themen 7
P HTML parsen Java Basics - Anfänger-Themen 2
W html parsen Java Basics - Anfänger-Themen 2
D HTML-Datei einlesen/parsen Java Basics - Anfänger-Themen 9
D HTML Code einlesen und nach Links parsen Java Basics - Anfänger-Themen 10
D HTML parsen Java Basics - Anfänger-Themen 8
W Javadoc HTML erzeugen mit allen dependency Java Basics - Anfänger-Themen 11
M html-seite drucken (gerendert) Java Basics - Anfänger-Themen 3
I HTML Code säubern Java Basics - Anfänger-Themen 4
B HTML File einlesen inkl. Bilder? Java Basics - Anfänger-Themen 2
B HTML Datei einlesen und HTML Code in String wandeln Java Basics - Anfänger-Themen 19
B HTML Code in XML speichern Java Basics - Anfänger-Themen 3
B HTML Code / Seite auslesen und JAVA Objekte erstellen Java Basics - Anfänger-Themen 12
K Erstes kleines Spieleprojekt - Java GUI in HTML einbinden Java Basics - Anfänger-Themen 3
B String nach HTML formatieren Java Basics - Anfänger-Themen 9
S HTML-Quelltext hinter HTTPS Java Basics - Anfänger-Themen 1
J Input/Output Input Buttons Html mit JSP Java Basics - Anfänger-Themen 3
E HTML in Java einbinden oder JavaScript? Java Basics - Anfänger-Themen 5
D Mit Java HTML bzw Javascript auslesen Java Basics - Anfänger-Themen 1
G Servlet - externe HTML (URL) auslesen Java Basics - Anfänger-Themen 1
S Text aus einer HTML Datei auslesen Java Basics - Anfänger-Themen 1
krgewb Input/Output Umlaute in generierter HTML-Datei Java Basics - Anfänger-Themen 7
N Status-Log - HTML Java Basics - Anfänger-Themen 12
C Methoden Welche JSoup Methoden Und Parameter für diese HTML Tags Java Basics - Anfänger-Themen 4
I Meta Tags vergleichen mit Html Vorgabe Java Basics - Anfänger-Themen 8
B HTML Code drucken Java Basics - Anfänger-Themen 4
D HTML Manipulation Navigation Java Basics - Anfänger-Themen 1
Z Html Element aus der Webseite auslesen Java Basics - Anfänger-Themen 1
D Erste Schritte HTML aus JEditorPane drucken Java Basics - Anfänger-Themen 5
M Fragen zum Auslesen von HTML Seiten Java Basics - Anfänger-Themen 5
M Java und Html Java Basics - Anfänger-Themen 4
I HTML Code in Bild (transparent) konvertieren Java Basics - Anfänger-Themen 0
I Watermark erstellen mit HTML in Bild? Java Basics - Anfänger-Themen 7
T Ausgabe in HTML :( Java Basics - Anfänger-Themen 19
F HTML Datei in .jar speichern und abändern Java Basics - Anfänger-Themen 2
S mit Java HTML Button drücken "lassen" Java Basics - Anfänger-Themen 8
M Erste Schritte Java Applet - HTML Seiten auslesen und in Access Datenbank schreiben? Java Basics - Anfänger-Themen 15
T HTML-Inputbox ansteuern Java Basics - Anfänger-Themen 4
I HTML Tabelle nur so lange erzeugen bis Höhe erreicht Java Basics - Anfänger-Themen 9
I HTML in String wandeln? Java Basics - Anfänger-Themen 1
D javacode durch Html ausfuehren Java Basics - Anfänger-Themen 13
W HTML Code, Umlaute werden nicht richtig dargestellt Java Basics - Anfänger-Themen 7
C Html in einem JEditorPane anzeigen Java Basics - Anfänger-Themen 2
I jar-Datei in HTML einbinden Java Basics - Anfänger-Themen 6
O HTML -> BBCode Parser? Java Basics - Anfänger-Themen 3
O Methode in andere Klasse verlegt, "auslesen" einer HTML Seite verschnellert - Problem. Java Basics - Anfänger-Themen 4
C Java Applet in html. Pong - old school Spiel Java Basics - Anfänger-Themen 10
J Methode um eine HTML-Datei zu öffnen Java Basics - Anfänger-Themen 10
H Schnell HTML-Tags finden Java Basics - Anfänger-Themen 5
H Welcher Html-Parser? Java Basics - Anfänger-Themen 8
G Probleme beim HTML auslesen Java Basics - Anfänger-Themen 6
J Html zugriff - POST Request/Response Java Basics - Anfänger-Themen 4
A HTML-Code auslesen und mit einem Wert in der property-Datei vergleichen Java Basics - Anfänger-Themen 2
Z Input/Output HTML-Seite einlesen Java Basics - Anfänger-Themen 4
H Interface JTextPane html formatiert kopieren Java Basics - Anfänger-Themen 2
L Applet soll Html-File öffnen Java Basics - Anfänger-Themen 2
L NetBeans Applet in html Java Basics - Anfänger-Themen 4
H Java Server/Client, HTML Seite anzeigen Java Basics - Anfänger-Themen 2
D Wie den HTML-Teil des Chat Tutorials aus dem FAQ-Bereich starten? Java Basics - Anfänger-Themen 5
C Link wie bei HTML Java Basics - Anfänger-Themen 7
F Methoden replaceAll (regex) HTML Java Basics - Anfänger-Themen 3
M Mit Java eine HTML-Seite speichern Java Basics - Anfänger-Themen 11
C Java in HTML einbinden Java Basics - Anfänger-Themen 2
N Website HTML mit JavaScript abrufen Java Basics - Anfänger-Themen 9
R JSON - Ausgabe als HTML mit gson Java Basics - Anfänger-Themen 6
R Suche Regex Ausdruck für HTML Java Basics - Anfänger-Themen 11
A JEditorPane + html -> java.io.IOException: invalid url Java Basics - Anfänger-Themen 4
S Lightbox Script vs. Taco HTML Script Java Basics - Anfänger-Themen 4
R Pattern bzw. Regex HTML-Code Java Basics - Anfänger-Themen 10
S String mit ASCII/HTML Zeichen darstellen Java Basics - Anfänger-Themen 10
S HTML Regularer Expression Java Basics - Anfänger-Themen 20
S regulärer Ausdruck HTML Java Basics - Anfänger-Themen 5
D Html Formular auswerten Java Basics - Anfänger-Themen 8
P Java Object das eine HTML Datei repräsentiert Java Basics - Anfänger-Themen 19
eLogic Einlesen von HTML-Source Java Basics - Anfänger-Themen 6
turmaline Ein regulärer Ausdruck für HTML-Sonderzeichen Java Basics - Anfänger-Themen 3
H html-Text mit Formatierung in String speichern Java Basics - Anfänger-Themen 4
S Java und HTML- Drop Down- Mehrfachauswahl Java Basics - Anfänger-Themen 3
A execute jar from html Java Basics - Anfänger-Themen 6
D Interpreter-Fehler JavaApplet läuft in der IDE aber nicht im HTML Dokument Java Basics - Anfänger-Themen 9
StupidAttack Html Code durchsuchen Java Basics - Anfänger-Themen 2
T Servlet HTML-Formular Java Basics - Anfänger-Themen 9
TheKing HTML Formular mit Java ausfüllen und absenden Java Basics - Anfänger-Themen 9
P HTML <input> Feld in einem JLabel auslesen Java Basics - Anfänger-Themen 4
C einfacher Link zu *.html Datei möglich? Java Basics - Anfänger-Themen 4
V javascript und HTML: hoch 2 Java Basics - Anfänger-Themen 2
M index.html fehlt Java Basics - Anfänger-Themen 12
3 Eine HTML Datei in eine Java Datei umschreiben Java Basics - Anfänger-Themen 23
Weltall 7 Applet in HTML einbinden Java Basics - Anfänger-Themen 3
A Java in Html einbinden Java Basics - Anfänger-Themen 2
M Frage zum Aufruf eines Applets aus einer HTML - Datei Java Basics - Anfänger-Themen 3
sylo Auf HTML-Dateien in einer Jar zugreifen Java Basics - Anfänger-Themen 9
D HTML Text von jButton disablen Java Basics - Anfänger-Themen 2
I CSV Datei auf HTML Seite hochladen und in DB laden Java Basics - Anfänger-Themen 9
K html to pdf Java Basics - Anfänger-Themen 6
D String aus Html (sonderfall) Java Basics - Anfänger-Themen 9
F html editor Java Basics - Anfänger-Themen 5
A html parser Java Basics - Anfänger-Themen 5
G HTML Seite generieren Java Basics - Anfänger-Themen 2

Ähnliche Java Themen

Neue Themen


Oben