DOM Parsen Problem mit HTML Sonderzeichen

Status
Nicht offen für weitere Antworten.

spass-digga

Mitglied
Hallo,

hab gerade ein kleines Problem beim Parsen von XML das ich von einem Webservice zurückgeliefert bekomme.

Codeauszug:

Java:
db = dbf.newDocumentBuilder();
dom = db.parse(in);
Element docEle = dom.getDocumentElement();
NodeList nl = docEle.getElementsByTagName("event");
Element entry = (Element)nl.item(1);
Element title = (Element)entry.getElementsByTagName("title").item(0);
String strTitel = title.getFirstChild().getNodeValue();
System.out.println("Titel: " + strTitel);

Funktioniert auch wunderbar. Es tritt nur eine Problem auf, wenn das Element title in der XML mit einen HTML Sonderzeichen beginnt. Beispiel:

<title>&quot;Klampfen für Ruhm und Freibier&quot;</title>

Dann erhalte ich als Ausgabe:

Titel: "

Das erste &quot; wird also in ein " umgewandelt und der Rest des Strings wird gar nicht gespeichert. Kann ich irgendwie nicht nachvollziehen ich hätte eine der folgenden Ausgaben erwartet:

Entweder:

Titel: "Klampfen für Ruhm und Freibier"

oder halt

Titel: &quot;Klampfen für Ruhm und Freibier&quot;

Die erste Variante wäre schön, mit der zweiten könnte ich zumindest weiterarbeiten. :) Aber da ich gar nicht erst an den vollständigen String rankomme kann ich damit nichts anfangen.

Hat jemand eine Idee wie man das umgehen kann? Vielen Dank schonmal.

Gruß
Rudi
 

Localtime

Mitglied
Hi spass-digga,

das sieht nicht danach aus, als ob der Fehler bei Dir liegt, sondern dass das HTML-Document nicht XML-Conform ist.

Tags nicht geschlossen (<br> statt <br />)
oder sowas: <div><span></div></span>

Grüße aus dem sonnigen Essen

Localtime
 

spass-digga

Mitglied
Hi, danke für dein Interesse. Die XML Datei ist korrekt aufgebaut. Der title tag wird richtig geschlossen. Klappt halt nur nicht, wenn in dem Tag HTML Sonderzeichen enthalten sind.

Beispiel 1 funktioniert:

<title>The Dad Horse Experience</title>

Beispiel 2:

<title>&quot;Klampfen für Ruhm und Freibier&quot;</title>

Liefert die oben geschilderte Ausgabe, es wird also nicht der komplette Inhalt des title Tags zurückgeliefert sondern nur das erste &quot; in ein Anführungszeichen umgewandelt. Wahrscheinlich müsste der Inhalt von title als CDATA deklariert werden, damit der Parser dies eins zu eins ausließt. Leider kann ich den Aufbau der Datei nicht beeinflussen, da dies ja wie gesagt die Antwort eines Webservices ist.

Gruß
Rudi
 

spass-digga

Mitglied
Juhu, ich konnte es endlich lösen. :) Also durch diese Sonderzeichen interpretiert des Parser den title Tag als Tag mit weiteren Unterknoten.

<title>&quot;Klampfen für Ruhm und Freibier&quot;</title> -> wird zu einem title Knoten mit 3 Kindknoten zerlegt

Ich hab mit meinem Konstrukt immer nur den ersten Kindknoten ausgelesen. Mit ner Schleife durchlauf ich jetzt alle Kindknoten und baue mir den String wieder zusammen.

Java:
String strTitel = title.getFirstChild().getNodeValue();
		          Integer k = title.getChildNodes().getLength();
		          if(k > 1){
		        	  NodeList nlTitle = title.getChildNodes();
		        	  for (int l = 1; l < k; l++){
		        		  strTitel = strTitel + nlTitle.item(l).getNodeValue();	  
		        	  }
		          }

Danke!

Gruß
Rudi
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
whitenexx Problem beim parsen von Facebook XML XML & JSON 3
T Problem beim Parsen von Attribut xmlns="urn:com:test&qu XML & JSON 6
MiMa Buch Metadaten aus XML Datei parsen XML & JSON 48
S XML Document Parsen und Ausgeben mit Suchfunktion XML & JSON 21
M parsen von realen HTML-WEB-Seiten XML & JSON 1
MiMa parsen mit regex -> ein schnelles Ende XML & JSON 10
K Beim Parsen einer XML-Datei Connection timed out XML & JSON 4
F Parsen von Daten aus einer Homepage XML & JSON 6
G Langsam beim SAX-Parsen - woran liegts? XML & JSON 2
C Parsen des XML-Streams mit SAX XML & JSON 3
M XML Datei Parsen XML & JSON 4
D SAX parsen - Wie? XML & JSON 11
S XML Parsen und Werte zwischenspeichern XML & JSON 2
K Kurze XML Datei Parsen XML & JSON 5
J Comments in XML parsen XML & JSON 3
H Nicht wohlgeformtes XML mit SAX parsen XML & JSON 2
M XML Parsen JDOM NullPointerEcxeption XML & JSON 7
Z XML parsen - Element mit Werten XML & JSON 2
ruutaiokwu xml nur bis auf eine bestimmte ebene parsen mit javax.xml... XML & JSON 5
L [SAX] Geschachtelte XML Datei parsen XML & JSON 3
R XML in UTF-8 mit SAX parsen XML & JSON 9
O Parsen einer XML mit JDOM ohne Doctype Declaration XML & JSON 2
F Probleme beim html parsen mit tagsoup XML & JSON 4
M Probleme beim Parsen eines gefilterten XML-Dokuments XML & JSON 6
Semox Kann JUnit XML Parsen? XML & JSON 2
L Reihenfolge beim xml Datei parsen einhalten? XML & JSON 8
L xml Datei parsen ohne End-Tag XML & JSON 6
T RSS-Feed parsen und in Datenbank speichern XML & JSON 6
B XML parsen XML & JSON 3
H XML parsen und unbekannten Namespace zurückgeben XML & JSON 5
L invalide xml document parsen?! XML & JSON 2
ABstraCT XML properties am einfachsten parsen. XML & JSON 2
U xmi parsen über emf XML & JSON 10
S XML-Schema einlesen um parsen zu erleichtern? XML & JSON 2
P XMLGregorianCalender parsen XML & JSON 4
M Datei parsen XML & JSON 5
S HTML mit dom4j parsen? XML & JSON 2
X XML File auslesen/parsen u. in ne Hashmap speichern XML & JSON 2
Saxony unbekannte XML Datei parsen und ausgeben XML & JSON 10
P "Formatierungs-Tags" parsen XML & JSON 3
M Attribute parsen XML & JSON 6
R Parsen einer XML ohne Validierung XML & JSON 2
D XML Datei innerhalb einer JAR Datei parsen XML & JSON 2
M Xerces -Parsen mit einer externen Schemadatei geht nicht XML & JSON 2
L bz2-Datei parsen XML & JSON 9
K XML parsen Whitespaces XML & JSON 2
I XML-String mit SAX parsen ? XML & JSON 2
M Object in XML parsen XML & JSON 2
byte Probleme beim Parsen von XHTML-Datei XML & JSON 4
P HTML Seite Parsen, und bestimmten Text extrahieren XML & JSON 3
X xml und xsl parsen mit xerces XML & JSON 8
W Xml-String parsen XML & JSON 2
W root element parsen,Hilfe! XML & JSON 5
F Gibt es Möglichkeiten Deutsche Sätze zu parsen ? XML & JSON 2
A Auf der Suche nach Bibliotheken oder wie parsen? XML & JSON 15
S XML Datei mit Schemafehler parsen XML & JSON 14
R StreamSource parsen ! XML & JSON 8
R RSS parsen XML & JSON 2
K XML Datei parsen XML & JSON 4
O XPATH Problem - Anfänger XML & JSON 4
so_ein_Komischer Problem mit Clean and Build XML & JSON 1
P JAXB-Problem XML & JSON 1
W Problem mit dem mit XML sortierung XML & JSON 2
S Jaxb Unmarshalling Problem XML & JSON 4
E einfaches Problem XML + XSD + jedit XML & JSON 2
S Xslt Problem XML & JSON 2
B JasperReport Problem in Runtime XML & JSON 2
S Problem with JAXB unmarshalling classes that have the same name in @XmlRootElement XML & JSON 2
R Problem bei: XML und XSL zu HTML XML & JSON 2
M Read / write Problem beim ByteStrom XML & JSON 2
M XML write Problem zweiter Ansatz XML & JSON 3
M XML read Problem XML & JSON 4
M XML write Problem XML & JSON 2
M XML Unicode Problem XML & JSON 2
S XJC --> Java-Objects compile Problem XML & JSON 4
F XPath-Problem mit DOM4J XML & JSON 8
B JPA + JAXB Mapping Problem XML & JSON 2
T XPath Problem: finden einer Node nach Attributswert XML & JSON 2
G Problem beim schreiben von XML in eine File XML & JSON 2
S Encoding Problem XML & JSON 7
K JAXB und Maps -> Marshalling-Problem XML & JSON 6
B Problem beim löschen von ChildNodes aus einem XML-DOM XML & JSON 3
E JDOM - Problem beim Zusammenfügen zweier Dateien XML & JSON 2
M JExcelAPI (JXL) Encoding Problem XML & JSON 11
A aus xml --> html Problem XML & JSON 3
Y stax Problem XML & JSON 3
slawaweis Problem mit XSLT (wahrscheinlich ein Bug in Java 6) XML & JSON 16
P XPath Problem XML & JSON 2
J Problem beim XML-Lesen XML & JSON 2
M Problem mit FOP in Java Programm XML & JSON 2
S Problem mit XPath XML & JSON 4
J Problem mit compile einer XSD XML & JSON 3
N jdom problem beim lesen von child elementen XML & JSON 5
N problem bei xml lesen mit jdom XML & JSON 2
A XPath Problem XML & JSON 2
W JDOM element ändern funzt nich :( [problem gelöst] XML & JSON 3
G Problem mit XML-Schema Validierung mit Java XML & JSON 12
B jdom: getChildren() problem XML & JSON 4
H XSL-FO Problem mit If XML & JSON 2
loadbrain XPath Problem XML & JSON 2

Ähnliche Java Themen

Neue Themen


Oben