HTML Datei mit SAXBuilder laden hängt sich auf

Airwolf89

Aktives Mitglied
Hallo Leute,

habe da mal wieder ein kleines Problem:

Ich arbeite mit JDom (1.1.2) und versuche ein HTML File zu laden um es weiter zu bearbeiten.
Das HTML File ist ganz simpel:

HTML:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">
<html>
    <head>
        <title></title>
        <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
    </head>
    <body></body>
</html>

Das versuche ich mit einem SAXBuilder zu laden, bei meinen normalen XML Files funktioniert das auch super. Nur beim HTML-File hängt sich das Teil auf. Kanns leider nicht genauer beschreiben, das Programm bricht nicht ab, aber es tut sich gar nichts mehr.

Mein Code sieht folgendermaßen aus:

Java:
 public String loadFile(String xmlh_path) {
        String xmlh_id = "";
        Document xmlh_doc = null;

        System.out.println("checkpoint a");
        System.out.println("path: " + xmlh_path);

        try {

            File f = new File(xmlh_path);

            System.out.println("checkpoint b");
            xmlh_doc = new SAXBuilder(false).build(f);

            System.out.println("checkpoint c");

            if (xmlh_doc.getRootElement() == null) {
                System.out.println("error building file, " + xmlh_path);
            } else {
                System.out.println("checkpoint d");
                xmlh_id = String.valueOf(xmlh_doc.hashCode());
                this.docColl.put(xmlh_id, xmlh_doc);
            }
            return xmlh_id;
        } catch (JDOMException ex) {
            Logger.getLogger(XMLHandler.class.getName()).log(Level.SEVERE, null, ex);
        } catch (IOException ex) {
            Logger.getLogger(XMLHandler.class.getName()).log(Level.SEVERE, null, ex);
        }
        return xmlh_id;
    }

Beim HTML File bleibt er dann zwischen checkpoint b und c stehen, da rührt sich einfach nix.

Das File an sich wird korrekt geladen, habe ich schon überprüft.

Was könnte da die Ursache sein? Habe schon versucht mich mit dem Debugger durchzuwühlen, aber das hat mir nicht viel gebracht. Er bleibt genau in der Datei XMLDocumentFragmentScannerImpl in der do-while Schleife bei event.next() hängen, da sagt mir der Debugger dass event in dem Kontext ne unbekannte Variable ist. (Keine Ahnung wie viel ich darauf geben kann)

Reicht euch das soweit an Informationen? Oder isses gar nicht so kompliziert und der kann einfach keine HTML Dateien parsen? XHTML ist ja im Grunde auch nur XML (korrigiert mich bitte falls ich falsch liege)

Hoffe ihr habt einen Rat für mich.

Danke im voraus.
 
B

...ButAlive

Gast
Deine Datei ist nicht wellformed, da das meta-Tag nicht geschlossen wird. Ob es daran liegt, dass sich der SaxParser aufhängt, kann ich dir leider nicht sagen, da ich es nicht ausprobiert habe.
 

Airwolf89

Aktives Mitglied
Hmm, daran lags auch nicht. Weder mit geschlossenem Tag noch komplett ohne Meta-Tag. Gleiches Ergebnis. XHTML Header müsste doch auch richtig sein, oder?

Aber danke schonmal für den Hinweis.
 

Airwolf89

Aktives Mitglied
Hmm, habe den "Fehler" gefunden. Er kommt einfach mit dem Header bzw. DocType nicht klar.

Wenn ich den rauslösche, dann gibts keine Probleme mehr. Konkret scheint das bei der URL im Doctype aufzutreten. Was kann denn da der Fehler sein?

ich verwende diesen Doctype hier:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">

Irgendwie kriegt er bei den Teilen in Anführungszeichen Probleme.
Habt ihr da ne Idee?

Danke im voraus.
 

mfernau

Bekanntes Mitglied
Hm - Soweit ich weiss ist HTML einfach kein XML. HTML ist abgeleitet von SGML. XML ist soetwas wie SGML aber um wesentliche Punkte vereinfacht. Aber ein XML-Parser parst nun mal XML und kein SGML/HTML.
Diese <DOCTYPE..> Geschichte kommt von SGML und ist daher kein XML. Ich denke Du musst diese DOCTYPE einfach vor dem parsen entfernen und natürlich analysieren ob es sich tatsächlich um XHTML handelt. Denn wenn nicht - wird Dein SAX Parser die Segel streichen :)
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
K Einlesen eines Parameters aus HTML-Datei XML & JSON 4
D Wie XML Datei einlesen und HTML entities übernehmen? XML & JSON 3
L mit Java eine HTML-Datei erstellen XML & JSON 3
F XML Datei als HTML? XML & JSON 4
B JAXB und HTML XML & JSON 1
T HTML mit Hilfe Jsoup einlesen XML & JSON 11
C javascript in .html Funktioniert, in .xhtml nicht mehr XML & JSON 0
M parsen von realen HTML-WEB-Seiten XML & JSON 1
P HTML XPath XML & JSON 1
1 Html tabelle auslesen??? XML & JSON 6
K docBook XSLT: HTML Code Snippet in Erzeugte HTML Dokument einfügen XML & JSON 9
R Problem bei: XML und XSL zu HTML XML & JSON 2
T Möchte JSP Code in Attribut eines HTML Tags hinein generieren XML & JSON 3
slawaweis XML Prettyprinter zu HTML XML & JSON 3
S Typsicherer HTML-Parser XML & JSON 5
S HTML Parser XML & JSON 2
F Probleme beim html parsen mit tagsoup XML & JSON 4
M HTML Quellcode verarbeiten XML & JSON 4
J DOM zu HTML XML & JSON 3
S DOM Parsen Problem mit HTML Sonderzeichen XML & JSON 4
A aus xml --> html Problem XML & JSON 3
M HTML-Entities XML & JSON 4
M Suche HTML-API XML & JSON 3
G Servlet mittels XSL in HTML konvertieren XML & JSON 5
K html -> cyberneko -> xml -> jdom . XML & JSON 3
S HTML mit dom4j parsen? XML & JSON 2
M TextContent eines XML-Elements enthält HTML-Tags . was nun XML & JSON 2
B html->xslfo->pdf XML & JSON 5
G HTML in PDF umwandeln XML & JSON 9
P HTML Seite Parsen, und bestimmten Text extrahieren XML & JSON 3
J Exception bei "vorselektiertem" HTML XML & JSON 3
C HTML-Befehle per Java entfernen XML & JSON 7
P HTML-Sting in JDOM XML & JSON 7
G HTML -> XML XML & JSON 2
A html-File nach txt-File konvertieren XML & JSON 15
flashfactor HTML in XML XML & JSON 3
FsMarine HTML to PDF Konventieren XML & JSON 6
P HTML mit JDOM erstellen und in JEditorPane zeigen XML & JSON 4
B JDom + HTML XML & JSON 2
B DOM oder HTML File drucken "wie ein Browser es zeigen w XML & JSON 3
T Tags in XML Datei mit Java erstellen XML & JSON 3
S XML Datei speichern nicht möglich XML & JSON 13
M Objekt zu jsonArray in .json datei hinzufügen ? XML & JSON 3
J Object in JSON Datei einlesen und als neues Object erzeugen (in ein Object Array) XML & JSON 29
I Mit Hibernate eine XML-Datei in eine Tabellenspalte einlesen. XML & JSON 1
MiMa Buch Metadaten aus XML Datei parsen XML & JSON 48
J Auslesen der Länge einer XML-Datei in Android Studio XML & JSON 8
R xlsx-Datei mit Apache POI einlesen XML & JSON 18
S Validierung einer XML-Datei - Führende Leerzeichen und Tabs XML & JSON 10
S CSV Datei einlesen und XML Ausgeben XML & JSON 2
U jar Datei mit ant erstellen XML & JSON 1
P wie kriege ich eine *.dtd Datei mit in die ausführbare *.jar? XML & JSON 2
K XML Datei erstellen und Daten daraus in Java auslesen XML & JSON 6
D XML-Datei per Button erstellen XML & JSON 3
K JAR-File mit XML-Datei XML & JSON 1
M Text eines Elements in XML Datei mit JAVA bearbeiten und kompletten Element-Zweig hinzufügen XML & JSON 16
I Liste in YAML Datei speichern und wieder auslesen XML & JSON 1
A Leeres Array beim Auslesen von XML-Datei XML & JSON 4
E JTreedaten in eine XML Datei speichern XML & JSON 3
D Int-Werte in XML-Datei schreiben (DOM) XML & JSON 2
B xsd-Datei ins jar file XML & JSON 5
T Formulardaten in XML Datei speichern XML & JSON 5
H Wsdl datei XML & JSON 2
D Große XML-Datei in einzel Dateien splitten XML & JSON 3
S Neue Inhalte in XML-Datei einfügen XML & JSON 0
S JDOM XML Datei darstellen Fehler! XML & JSON 2
S Xml File für den Aufbau einer anderen Xml Datei XML & JSON 6
M XML-Datei mit JAXB und 2 Namespaces XML & JSON 0
J XML - Datei wird nicht ganz angezeigt XML & JSON 2
P (Eclipse)Ant Script, .jar Datei erstellen mit MANIFEST.MF XML & JSON 12
Z XML Datei mit JDOM einlesen und verarbeiten XML & JSON 6
K Beim Parsen einer XML-Datei Connection timed out XML & JSON 4
E ResultSet als XML Datei speichern XML & JSON 7
M XStream, CSV Datei XML & JSON 9
A Frage zu bestehender XML Datei XML & JSON 6
A Simple Constructor Injection Datei-Pfad XML & JSON 6
Maxim6394 Lesen/Schreiben von XML Datei XML & JSON 9
A XML datei lesbar speichern (eingerückt) XML & JSON 7
M XML Datei Parsen XML & JSON 4
N Java Code aus XML Datei generieren XML & JSON 8
D Aus lesen einer XML-Datei ( 1 root, 3 childs) XML & JSON 7
R XLM Datei lesen Ändern (kompliziertes Search and Replace) und Speichern XML & JSON 12
K Kurze XML Datei Parsen XML & JSON 5
S XSD-Datei zulässige Werte auslesen XML & JSON 3
M XML Datei heapspace erreicht XML & JSON 3
M Große Datei auslesen/in dieser suchen XML & JSON 2
S Konforme XML Datei über XSD erstellen XML & JSON 2
M RSS-Datei auslesen von Yahoo Webservice XML & JSON 4
T Inhalt einer .xml Datei auf Javaoberfläche wiedergeben XML & JSON 4
M XML Datei drucken XML & JSON 8
T Daten aus Programm in XML Datei speichern XML & JSON 2
D XSD Datei erstellen XML & JSON 4
L [SAX] Geschachtelte XML Datei parsen XML & JSON 3
E XML Datei mit DOM auslesen (Text mit Attributen) XML & JSON 2
G txt. Datei in xml datei konvertieren XML & JSON 21
K XML Datei in ein Java package „einbinden" XML & JSON 3
L Reihenfolge beim xml Datei parsen einhalten? XML & JSON 8
L xml Datei parsen ohne End-Tag XML & JSON 6
C if-Abfrage mit Datei Variable aus XML-Datei XML & JSON 2
sylo Beim Erzeugen einer XML Datei auch die XML Struktur erzeugen? XML & JSON 11

Ähnliche Java Themen

Neue Themen


Oben