nicht wohl-geformte XML in wohlgeformte XML umwandeln

Status
Nicht offen für weitere Antworten.

p-flash

Aktives Mitglied
Hi,

kennt jemand ein Tool, das sowas kann? Habe mir schon tidy und tagSoup angeschaut. Das Problem ist, dass diese nach den Regeln von html arbeiten. D.h. Sowas wie <div>ein Div</div> ist nicht erlaubt. tagSoup wandelt es um in <div>ein Div</div>. Bei XML-Dateien ist das aber nicht erwünscht.

Bin dankbar für jede Info.

p-flash
 

byte

Top Contributor
Wie soll das denn gehn? Eine nicht wohl geformte XML Datei ist kein XML. Und man kann auch nicht aus Stroh Gold machen. ;)

Es mag sein, dass es Tools gibt, die einfache Syntaxfehler selbstständig beheben können oder altes HTML in XHTML umwandeln, aber sonst?

Erklär mal genauer, was Du brauchst!
 

p-flash

Aktives Mitglied
Hi,

wenn z.B. ein Root Element fehlt, soll er eingefügt werden, nicht geschlossene Tags sollen automatisch geschlossen werden und sowas wie:

<root>
<knoten1 />
<knoten2 />
freiliegender Text
</root>

soll so umgewandelt werden:

<root>
<knoten1 />
<knoten2 />
<text>freiliegender Text</text>
</root>


(oder wäre es auch ohne der letzten Änderung wohlgeformt?)

Also, eigentlich relativ simple. Also tagSoup ist schon ziemlich gut, es ist halt das problem dass die html-semantik mitberücksichtigt wird.

p-flash
 

byte

Top Contributor
Und woher soll ein solches Tool wissen, an welcher Stelle z.B. ein "kaputtes" Tag geschlossen werden soll?

Bei folgendem Beispiel gäbe es drei Stellen, wo man </broken> einfügen könnte:

Code:
<root>
<broken>
<foo>bar</foo>
<bar>foo</bar>  
</root>

Es müsste schon ein XML-Schema gegeben sein, um sowas zu automatisieren.

PS:
p-flash hat gesagt.:
(oder wäre es auch ohne der letzten Änderung wohlgeformt?)
Ja, wäre es! ;)
 

p-flash

Aktives Mitglied
Ja, da hast du natürlich Recht. Hmm...mal schauen was ich sonst für alternativen habe. Danke.

p-flash
 

Ullenboom

Bekanntes Mitglied
Hallo!

Unter http://www.tutego.com/javabuch/javainsel6/javainsel_13_009.htm#Xxx1000276 habe ich zwei Lösungen kurz vorgestellt. Angenehm ist das bei HTML-Eingaben, die nicht immer so sind, dass man sie ordentlich weiterverarbeiten kann. Für HTML ist das nützlich. Eine Lib konvertiert Gammel-HTML zunächst in XML und dann kann man komfortable XPath-Anfragen nutzen --- so lassen sich sehr leicht Sachen aus Webseiten herausziehen.

Grüße

Christian
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
M SOAP-Client funktioniert plötzlich nicht mehr XML & JSON 2
I ID von Referenz speichern, nicht ganzes Objekt XML & JSON 1
S XML Datei speichern nicht möglich XML & JSON 13
T Fehler: Hauptklasse com.sun.tools.internal.xjc.XJCFacade konnte nicht gefunden oder geladen werden XML & JSON 6
W jaxb-api XML Feld nicht gesendet setzt das Defaultvalue nicht XML & JSON 3
M dom4j detach funktioniert nicht XML & JSON 0
H XML Element `Class` wird nicht gelesen XML & JSON 2
C javascript in .html Funktioniert, in .xhtml nicht mehr XML & JSON 0
S xml mit SAX. Sonderzeichen belassen, nicht umsetzen. No "&gt;" in ">" XML & JSON 1
GianaSisters Webservice Integer/Double bitte nicht mitübertragen XML & JSON 2
S Apache Ant - Fehler: Hauptklasse konnte nicht gefunden oder geladen werde XML & JSON 1
H Apache fop1.1 -> Funktion last() wird nicht erkannt XML & JSON 0
D Xml nicht überschreiben! XML & JSON 1
S NodeList rückwärts scannen, alle Parent Nodes ausgeben rekursiv und nicht-reukrsiv XML & JSON 0
E Wie geht man mit Textfiles um, die nicht in Form von XML vorliegen? XML & JSON 4
J XML - Datei wird nicht ganz angezeigt XML & JSON 2
S DTD und XML lassen sich nicht verknüpfen XML & JSON 2
S XML file lässt sich in Eclipse nicht erstellen XML & JSON 2
N Java XML schreiben funktioniert nicht XML & JSON 1
F.S.WhiTeY JAXB: Schema nicht "erben" XML & JSON 2
S Node.setTextContent funktioniert nicht XML & JSON 3
K Verwirrung: Per SSH werden manche Befehle ausgeführt, manche nicht XML & JSON 10
Helgon JDOM schreibt nicht XML & JSON 2
G xml, jdom "Entität wurde referenziert aber nicht deklariert." XML & JSON 4
K Main Methode wird nicht aufgerufen XML & JSON 15
H XML via XSD Validierung nicht möglich? XML & JSON 2
S XML-Serialisierung klappt nicht XML & JSON 5
H Nicht wohlgeformtes XML mit SAX parsen XML & JSON 2
T XML JTree änder sich nicht XML & JSON 2
C DOM: Attribute nicht in alphabetischer Reihenfolge schreiben XML & JSON 3
A XML schaffe es nicht Nodes auszulesen XML & JSON 5
G Wieviele Elemente von TagName, ich brings nicht hin XML & JSON 5
M XSD - Child Element möglich, aber nicht zwingend erforderlich XML & JSON 6
_dp Java XML Parse error: findet end-tags nicht XML & JSON 10
sylo Nach Export wird SAXParseException nicht mehr geworfen XML & JSON 4
aze JaxB: Nullelemente in Array nicht anzeigen XML & JSON 3
G XPath - replace function funktioniert nicht XML & JSON 3
B Unterschied? Beides Attribut oder nicht? XML & JSON 2
aze JaxB Elemente in LinkedHashSet werden nicht wiededergegeben XML & JSON 3
G Nodes in Document kopieren, nur die Childs, die noch nicht existieren XML & JSON 7
E Wieso liefert dieser XPATH-Ausdruck nicht die richtige Anzahl Treffer? XML & JSON 8
L XML Dokument auslesen funktioniert nicht richtig XML & JSON 2
S finde den Schema-Compiler "xjc" nicht XML & JSON 4
N XML will nicht weder JAXB noch XStream XML & JSON 8
P PHP-Seite anfragen, aber nicht darstellen XML & JSON 5
P XSD Schema: Konstanten mit "fixed" erzeugen geht nicht ??? XML & JSON 3
C Validierung klappt nicht mit Schema XML & JSON 2
F XML Suche funktioniert nicht XML & JSON 5
D nicht (ganz) valiedes XML einlesen! XML & JSON 19
C jdom.Element nicht vorhanden? XML & JSON 4
C XPath in JDOM klappt nicht XML & JSON 2
J Daten werden in ArrayList geschrieben, AL nicht in .xml ? XML & JSON 5
V XMLEncoder: Attribute nicht serialisieren XML & JSON 2
R iReport will nicht XML & JSON 4
T XML-Parsing: Whitespace zw. Elementen wird nicht ignoriert XML & JSON 4
8 SAXParser Problem, startElement wird nicht ausgeführt XML & JSON 2
M Xerces -Parsen mit einer externen Schemadatei geht nicht XML & JSON 2
H xml - Schema : warum passen die nicht zueinander XML & JSON 2
J [Newbie] [JDOM] Element aus XML entfernen klappt nicht XML & JSON 4
P SAXBuilder wird von Eclipse nicht als ObjektTyp erkannt XML & JSON 3
B JDom -- getChild() liefert nicht nachvollziehbar null XML & JSON 2
K XML to file geht nicht :( XML & JSON 4
S Element addContent(Element) gibts nicht XML & JSON 5
M mit JDOM XML-Datei einlesen, die nicht "well-formed&quo XML & JSON 3
D XML Datei wird nicht gefunden XML & JSON 4
C xpath funktioniert nicht XML & JSON 5
M attribute funken nicht XML & JSON 3
B Validieren meines XMLs mit meiner DTD funktioniert nicht XML & JSON 9
M getChildren gibt nicht alle children zurück XML & JSON 3
P zugriff auf gewuenschte elemente klapp nicht. XML & JSON 3
T Warum passt diese DTD-Zeile nicht zu diesem Dokument? XML & JSON 7
A Element an einer bestimmten Stelle einfügen (nicht am Ende) XML & JSON 4

Ähnliche Java Themen

Neue Themen


Oben