Typsicherer HTML-Parser

sina.die

Mitglied
Hallo,

kann mir jemand einen Java Html-Parser empfehlen?
Ich hätte gern einen, der mit ein möglichst typsicheres Modell erzeugt. Also so, dass z.B. ein p-Tag ein Objekt der Klasse ParagraphTag ist.
Hier HTML Parser 2.0 seh ich schon sowas. Ich hab aber blöderweise nicht bei allen HTML-Parsern ein Liste gefunden, welche Tags unterstützt werden (bzw. ob sie überhaupt typsicher arbeiten). Wenn es noch einen anderen geben würde, der noch mehr Tags unterstützen würden, als der oben genannte, wär's super.

Danke schonmal!

Sina
 

Marco13

Top Contributor
Bin nicht ganz sicher, was du mit "Typsicher" meinst. Typsicher im Java-Typ-Sinn? Ich fand Jericho HTML Parser ganz gut, weil er robust auch "kaputten" Code parst, IMHO relativ leicht zu verwenden und relativ mächtig ist, und man aus Basis der Beispiel-Schnipsel schnell was basteln kann. Aber je nach Anwendung, Zielsetzung und Anforderungen kann auch ein anderer geeigneter sein.
 

sina.die

Mitglied
Bin nicht ganz sicher, was du mit "Typsicher" meinst. Typsicher im Java-Typ-Sinn?
Hmm, naja, ich meine so, dass ich beim Parsen gleich den Tag mit dem richtigen Typen bekomme. Also z.B. ein Objekt der Klasse "ParagraphTag", statt einem "Tag" bei einem geparsten <p>.

weil er robust auch "kaputten" Code parst
Der HTML-Code ist zum Glück ziemlich heil. :)

Edit:
Achso und die Anforderung: Es sollen einige Tags in ein anderes Format umkonvertiert werden. Die Typsicherheit, wär dabei eine große Hilfe.
 
Zuletzt bearbeitet:

Marco13

Top Contributor
Ja, das meinte ich - aber ich bin nicht sicher, wie genau das ablaufen soll. Wenn man einen Node hat, und sich davon die Children holt, kann das erstmal nur eine Liste mit ziemlich "unspezifischen" Elementen sein (d.h. vermutlich wieder nur "Nodes"). Dass davon eines vielleicht ein <p> Tag ist, und eines vielleicht ein <div>, muss man dann wohl überprüfen.
Aber vielleicht hat ja noch jemand eine Idee...
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
B JAXB und HTML XML & JSON 1
T HTML mit Hilfe Jsoup einlesen XML & JSON 11
C javascript in .html Funktioniert, in .xhtml nicht mehr XML & JSON 0
M parsen von realen HTML-WEB-Seiten XML & JSON 1
P HTML XPath XML & JSON 1
K Einlesen eines Parameters aus HTML-Datei XML & JSON 4
1 Html tabelle auslesen??? XML & JSON 6
Airwolf89 HTML Datei mit SAXBuilder laden hängt sich auf XML & JSON 4
K docBook XSLT: HTML Code Snippet in Erzeugte HTML Dokument einfügen XML & JSON 9
D Wie XML Datei einlesen und HTML entities übernehmen? XML & JSON 3
R Problem bei: XML und XSL zu HTML XML & JSON 2
T Möchte JSP Code in Attribut eines HTML Tags hinein generieren XML & JSON 3
slawaweis XML Prettyprinter zu HTML XML & JSON 3
S HTML Parser XML & JSON 2
F Probleme beim html parsen mit tagsoup XML & JSON 4
M HTML Quellcode verarbeiten XML & JSON 4
J DOM zu HTML XML & JSON 3
S DOM Parsen Problem mit HTML Sonderzeichen XML & JSON 4
A aus xml --> html Problem XML & JSON 3
M HTML-Entities XML & JSON 4
M Suche HTML-API XML & JSON 3
G Servlet mittels XSL in HTML konvertieren XML & JSON 5
K html -> cyberneko -> xml -> jdom . XML & JSON 3
S HTML mit dom4j parsen? XML & JSON 2
M TextContent eines XML-Elements enthält HTML-Tags . was nun XML & JSON 2
L mit Java eine HTML-Datei erstellen XML & JSON 3
B html->xslfo->pdf XML & JSON 5
G HTML in PDF umwandeln XML & JSON 9
P HTML Seite Parsen, und bestimmten Text extrahieren XML & JSON 3
J Exception bei "vorselektiertem" HTML XML & JSON 3
C HTML-Befehle per Java entfernen XML & JSON 7
P HTML-Sting in JDOM XML & JSON 7
G HTML -> XML XML & JSON 2
A html-File nach txt-File konvertieren XML & JSON 15
F XML Datei als HTML? XML & JSON 4
flashfactor HTML in XML XML & JSON 3
FsMarine HTML to PDF Konventieren XML & JSON 6
P HTML mit JDOM erstellen und in JEditorPane zeigen XML & JSON 4
B JDom + HTML XML & JSON 2
B DOM oder HTML File drucken "wie ein Browser es zeigen w XML & JSON 3
pkm Gibt es XML-Parser-Bibliotheken XML & JSON 3
B XML-Daten mit SAX Parser verarbeiten in Java XML & JSON 4
MiMa SAX-Parser beenden? XML & JSON 5
K GSON-Parser XML & JSON 6
K XML-Parser vs. XLST XML & JSON 4
L DOM Parser Implementieren XML & JSON 9
M SAX Parser implementieren XML & JSON 2
E Gibt es denn einen XML-Parser für JUnit-Tests? XML & JSON 6
D XSD Parser XML & JSON 1
T Neuer XML Parser!!! XML & JSON 33
J XML Parser anhand xsd erzeugen XML & JSON 2
H SAX Parser optimieren XML & JSON 5
H Sax Parser verschluckt teile XML & JSON 11
C XML SAX Parser XML & JSON 10
R Handler-Wechsel, SAX Parser bricht nach 8192 Byte ab XML & JSON 5
B SAX-Parser - Dokumente einlesen und in einer Map ablegen XML & JSON 2
S Sax Parser Performance XML & JSON 2
M Eigener XML-Parser XML & JSON 1
B Parser und Fabrik XML & JSON 6
F SAX Parser siehe nichts auf dem Konsole weder eine Fehlermeldung noch eine Ergebnis XML & JSON 6
enne87 SAX-Parser XML & JSON 5
C Mit SAX Parser XML Attribute auswerten XML & JSON 3
H XML-Parser: geparste Strings in Konstruktor? XML & JSON 9
S DOM Parser XML & JSON 12
S Sax Parser XML & JSON 3
D Speicherüberlauf bei character-Methode mit SAX-Parser XML & JSON 3
Y Welchen XML Parser / Klassen aus XSD generieren lassen XML & JSON 4
H Brauche ich einen speziellen XML-Parser? XML & JSON 2
M Unhierarchisches XML-File mit DOM-Parser auswerten XML & JSON 5
G XML Parser Fehler, zwei gleiche kind-Elemente XML & JSON 7
S Welcher XML-Parser am besten? XML & JSON 4
S Parser XML & JSON 2
S JAVA XML Parser der einen String parst XML & JSON 3
Noar XML-Parser mit GUI? XML & JSON 2
R Problem mit SAX-Parser characters() XML & JSON 7
K SAX Parser Character Puffer zu klein XML & JSON 2
B Mit Sax-Parser validieren XML & JSON 7
Wildcard xpath Parser XML & JSON 8

Ähnliche Java Themen

Neue Themen


Oben