html -> cyberneko -> xml -> jdom .

Status
Nicht offen für weitere Antworten.
K

katja123

Gast
Hallo,

ich versuche einen html-Quelltext in einen xml-text umzuwandeln mit hilfe von CyberNeko (NekoHTML), weil ich danach mit JDOM auf das File zugreifen will, um es besser durchsuchen zu können.

Ich habe mich dabei an Vorgaben von "Java ist auch eine Insel" orientiert

https://www-rz.uni-hohenheim.de/anw/programme/prg/java/tutorials/javainsel4/javainsel_13_006.htm
(ganz unten)

Mein Code (als Fragment) sieht folgendermaßen aus:

Code:
// imports der Übersichtlichkeit halber weggelassen

public class QinXML {
	
	InputStream quelltext;
	
	public void umwandeln() {
	
		org.cyberneko.html.parsers.DOMParser parser = 
			new org.cyberneko.html.parsers.DOMParser(); 

		try {	
			parser.parse( new InputSource(quelltext) );
		}
		catch (Exception e){
			System.out.println(e.getMessage());
			
		}

		DOMBuilder builder = new DOMBuilder(null);
		org.jdom.Document document = builder.build( parser.getDocument() );

	}
}

Die Errormeldung ist folgende:

Code:
Exception in thread "main" java.lang.Error: Unresolved compilation problem: 
	The method build(Document) is undefined for the type DOMBuilder

Was mache ich falsch!?

Für Hilfe wäre ich sehr dankbar!
 
K

katja123

Gast
Problem gelöst.
Keine Ahnung wie, aber auf einmal funktionierte es soweit.

Kann geloescht werden.
 

hama

Mitglied
Hallo,

ich möchte eine HTML-Stei in eine XHTML-Seite parsen lassen, und ich habe jetzt ein Problem mit der Zeile:
org.jdom.Document document = builder.build( parser.getDocument() );
eclipse sagt: "The method build(Document) is undefined for the type DOMBuilder" .. !
Ich werde sehr dankbar, wenn Du eine Lösung oder vielleicht eine andere Vorschlag hast.
hier ist der Java-Code:
Java:
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.StringReader;

import org.cyberneko.html.parsers.DOMParser;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;

import com.sun.org.apache.xml.internal.utils.DOMBuilder;



public class HTMLParser {
	
	public HTMLParser(){}
	
 
	
	public String html_to_xhtml() throws SAXException, IOException {
	
		String htmlFragment = "xxx.html";	
		InputStream in = new FileInputStream( htmlFragment );		
		
		// set up Neko parser, set html tag fixing routines and namespaces on
		org.cyberneko.html.parsers.DOMParser parser = new DOMParser();

		parser.setFeature(
		   "http://cyberneko.org/html/features/balance-tags", true);
		parser.setProperty(
		   "http://cyberneko.org/html/properties/names/elems", "lower");
		parser.setFeature(
		   "http://cyberneko.org/html/features/override-namespaces", true);
		parser.setFeature(
		   "http://cyberneko.org/html/features/insert-namespaces", true);
		parser.setProperty(
		   "http://cyberneko.org/html/properties/namespaces-uri", "http://www.w3.org/1999/xhtml");
		            
		// parse html fragment, fix it and return full and valid XML document
		try {	

		parser.parse(
		   new InputSource(
		   new StringReader(in.toString())));
		}
		catch (Exception e){
			System.out.println(e.getMessage());
			
		}

		DOMBuilder builder = new DOMBuilder(null);
		org.jdom.Document document = builder.build( parser.getDocument() );

		System.out.println(parser.getDocument());
		return  parser.getDocument().toString();


		

	}
	
	public static void main( String[] args ) throws SAXException, IOException { 
		HTMLParser htmlparser = new HTMLParser(); 
		htmlparser.html_to_xhtml();
	} 
	
}

shöne Grüße,
Hama
 

Noctarius

Top Contributor
Die Fehlermeldung sagt doch schon, dass es eine Methode build(Document) nicht gibt. Da ist das einfachste dann ins Javadoc zu schauen wie die Parameter von build sein dürfen.
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
B JAXB und HTML XML & JSON 1
T HTML mit Hilfe Jsoup einlesen XML & JSON 11
C javascript in .html Funktioniert, in .xhtml nicht mehr XML & JSON 0
M parsen von realen HTML-WEB-Seiten XML & JSON 1
P HTML XPath XML & JSON 1
K Einlesen eines Parameters aus HTML-Datei XML & JSON 4
1 Html tabelle auslesen??? XML & JSON 6
Airwolf89 HTML Datei mit SAXBuilder laden hängt sich auf XML & JSON 4
K docBook XSLT: HTML Code Snippet in Erzeugte HTML Dokument einfügen XML & JSON 9
D Wie XML Datei einlesen und HTML entities übernehmen? XML & JSON 3
R Problem bei: XML und XSL zu HTML XML & JSON 2
T Möchte JSP Code in Attribut eines HTML Tags hinein generieren XML & JSON 3
slawaweis XML Prettyprinter zu HTML XML & JSON 3
S Typsicherer HTML-Parser XML & JSON 5
S HTML Parser XML & JSON 2
F Probleme beim html parsen mit tagsoup XML & JSON 4
M HTML Quellcode verarbeiten XML & JSON 4
J DOM zu HTML XML & JSON 3
S DOM Parsen Problem mit HTML Sonderzeichen XML & JSON 4
A aus xml --> html Problem XML & JSON 3
M HTML-Entities XML & JSON 4
M Suche HTML-API XML & JSON 3
G Servlet mittels XSL in HTML konvertieren XML & JSON 5
S HTML mit dom4j parsen? XML & JSON 2
M TextContent eines XML-Elements enthält HTML-Tags . was nun XML & JSON 2
L mit Java eine HTML-Datei erstellen XML & JSON 3
B html->xslfo->pdf XML & JSON 5
G HTML in PDF umwandeln XML & JSON 9
P HTML Seite Parsen, und bestimmten Text extrahieren XML & JSON 3
J Exception bei "vorselektiertem" HTML XML & JSON 3
C HTML-Befehle per Java entfernen XML & JSON 7
P HTML-Sting in JDOM XML & JSON 7
G HTML -> XML XML & JSON 2
A html-File nach txt-File konvertieren XML & JSON 15
F XML Datei als HTML? XML & JSON 4
flashfactor HTML in XML XML & JSON 3
FsMarine HTML to PDF Konventieren XML & JSON 6
P HTML mit JDOM erstellen und in JEditorPane zeigen XML & JSON 4
B JDom + HTML XML & JSON 2
B DOM oder HTML File drucken "wie ein Browser es zeigen w XML & JSON 3
P JDOM oder SAX XML & JSON 3
Hijo2006 Grundsätzliches zu JDOM 2.x XML & JSON 1
W Kindelemente mit JDOM eines bestimmten Attributes auslesen XML & JSON 6
S JDOM XML Datei darstellen Fehler! XML & JSON 2
S JDom XML ein Element hinzufügen. XML & JSON 1
C JDOM: Value ohne Unterelemente auslesen XML & JSON 1
Z XML Datei mit JDOM einlesen und verarbeiten XML & JSON 6
J JDOM XMLOutputter getPrettyFormat() XML & JSON 3
H JDOM setAttribute Reihenfolge XML & JSON 3
B XML aus einer URL im Internet lesen (JDOM) XML & JSON 4
F Aus XML mit JDOM aus Elementattributen Werte rauslesen XML & JSON 4
R sax, stax, jdom, jaxb? List von Objekten speichern und laden XML & JSON 6
C xml validierung gegen xsd mit jdom: Fehlermeldung Cannot find the declaration of element ... XML & JSON 8
T Dom, Jdom, Sax XML & JSON 8
Helgon MalformedByteSequenceException und null JDOM Attribute XML & JSON 5
Helgon JDOM schreibt nicht XML & JSON 2
A XSl mit JDom auslesen XML & JSON 1
G xml, jdom "Entität wurde referenziert aber nicht deklariert." XML & JSON 4
A XSL und JDom XML & JSON 3
G jdom-Klassen in Eclipse importieren XML & JSON 2
S JDOM ohne XML Header erzeugen? XML & JSON 2
G JDOM - aus Children-Liste ein Child direkt ansprechen ohne XPath? XML & JSON 9
S JDOM nur Attribut Name XML & JSON 2
X JDom für SOAP Dateien geeignet? XML & JSON 3
T Xpath & JDOM Element Pfad ausgeben XML & JSON 2
M XML Parsen JDOM NullPointerEcxeption XML & JSON 7
S jdom hasChildren()? XML & JSON 1
T Frage zu getContent unter jdom XML & JSON 6
Z Tutorial für JDOM (XSD-Shema) XML & JSON 3
D jdom, xml, login-system XML & JSON 4
N JDOM: XML einlesen XML & JSON 4
O Parsen einer XML mit JDOM ohne Doctype Declaration XML & JSON 2
lordcarlos jdom zu iso-8859-15 zwingen XML & JSON 4
P jdom XML-Encoding auslesen XML & JSON 12
E JDOM - letzem child Attribut hinzufügen XML & JSON 4
H Schema-Validierung mit JDOM XML & JSON 2
lordcarlos JDOM und entfernen von children XML & JSON 4
E JDOM - Problem beim Zusammenfügen zweier Dateien XML & JSON 2
T jdom.jar als Relativer Pfad in Eclipse einbinden XML & JSON 4
sparrow JDom Element.getChild("Name") liefert null obwohl vorhanden XML & JSON 4
S XML, UTF-8, JDOM und Umlaute XML & JSON 3
E XML - JDOM - Bäume: was würdet ihr hier machen? XML & JSON 11
A JDOM: Wert schreiben bzw. ändern XML & JSON 6
T JDOM Bibiliothek XML & JSON 3
K JDOM vs. DOM, Schnittstellen XML & JSON 5
P Große XML Datei mittels JDOM bearbeiten / einlesen XML & JSON 6
0x7F800000 jdom mit xml.transform inkompatibel, was soll ich nehmen? XML & JSON 2
T EXSD auslesen mit XPath und JDOM XML & JSON 8
A JDOM und Sonderzeichen < > XML & JSON 17
G Simples XML File einlesen mit JDom. Prefix not bound ? XML & JSON 2
N jdom problem beim lesen von child elementen XML & JSON 5
N problem bei xml lesen mit jdom XML & JSON 2
S Ampersand im Jdom-Element XML & JSON 2
N jdom - xslt-Verweis in .xml einfügen XML & JSON 3
S Jdom+java webstart XML & JSON 4
I JDom Text ändern XML & JSON 4
C jdom.Element nicht vorhanden? XML & JSON 4
W JDOM element ändern funzt nich :( [problem gelöst] XML & JSON 3
C XPath in JDOM klappt nicht XML & JSON 2
S Harte Nuss mit XML und JDOM XML & JSON 2

Ähnliche Java Themen

Neue Themen


Oben