sax parse exception invalid XML character

Status
Nicht offen für weitere Antworten.
X

xmlNeuling

Gast
Hallo,

ich hätte eigentlich eine ganz einfache Frage. Ich habe ein XML-Dokument kodiert mit
Code:
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
.
In einem Eintrag befindet sich das ungültige Zeichen &#26. Ich versuche das Dokument mittels org.w3.dom einzulesen und bekomme dann eine SaxParseException wegen dem ungültigen Zeichen. Jetzt habe ich versucht das File als Base64 einzulesen wie folgt:
Code:
DocumentBuilderFactory factory  = DocumentBuilderFactory.newInstance();
DocumentBuilder        builder  = factory.newDocumentBuilder();
Document document;
InputStream is=new FileInputStream(xmlFile);
document = builder.parse(is,"Base64");

Leider ohne Erfolg. Da ich wenig Erfahrung mit XML habe eine ganz einfache Frage:
Ich möchte einen Eintrag einlesen können aus dem XML Dokument auch wenn dieser fehlerhafte Zeichen hat und somit einen ParseError auslöst. Ist des möglich? Gibt es eine Möglichkeit auf ignoreParseErrors zu schalten? Mein Problem ist ich habe in einer XML Datei mehrere Datensätze und mit Dom eingelesen führt es dazu das bei nur einem fehlerhaften Datensatz alle Datensätze nicht gelesen werden. Ich könnte das natürlcih auch direkt mit SAX einlesen aber dann würde ich auch zumindestens den 'fehlerhaften' Eintrag mit dem verbotenen Zeichen nicht bekommen.
Ich bin mir jetzt dabei zu überlegen mit Regex einen XML Reader zu basteln wenn es mit einem der vielen XML Parser nicht möglich sein sollte auch fehlerhafte Einträge auszulesen.

Mit freundlichen Grüßen
 

mikachu

Top Contributor
bist du dir sicher, dass die xml-datei utf-8-konform ist?!?
wenn die das ist, kannst du die einfach so parsen, musst aber die codierung mit angeben ("UTF-8"), da die standardmäßig auf ISO-nochwas gesetzt ist.

es sieht IMO ganz so aus, als ob die xml nicht utf-8-konform gebaut ist!


#edit 1: der beitrag sollte besser in das "XML & Co." Forum!!!
 
X

xmlNeuluing

Gast
Hi,

wahrscheinlich ist die xml-Datei nicht UTF-8 konform. Habe zwar am Anfang

Code:
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>

aber weiter dann diesen Parserror wegen
,natürlich zusammengeschrieben, was ja kein UTF-8 ist. Ich meine dass ist Control.
Aber trotzdem muß es doch ne Möglichkeit geben so ein File einzulesen??!!

Deshalb dachte ich wenn ich sie als Base64 einlese dass es egal ist was da drin ist, den meiner Annahme kann Base64 alles lesen.
Inzwischen habe ich mir mit Regex nen Leser geschrieben, funzt aber trotzdem interessiert mich wie ich des mit nem XML-Parser realisieren kann.


Sorry dass ich in das falsche Unterforum gepostet habe.

Gruß
 
G

Gast

Gast
hatte letzt ein ähnliches problem mit einem xml, dessen encoding völlig vermurkst war und leider nicht besser erzeugt werden konnte. hab auch nach ner möglichkeit gesucht, xerces mit auf den weg zu geben, alle ungültigen zeichen zu "ignorieren" und nichts gefunden.

hab mir dann beholfen, indem ich den input stream durch nen filter gejagt hab, der alle zeichen prüft und bei bedarf durch was gültiges ersetzt. geholfen hat mir dabei, im xml als encoding erstmal iso-8859 anzugeben. das hat nämlich den vorteil, dass kein encoder auf den bolzen kommt, nach 2,3 und 4 bittigen unicode präambeln zu suchen und das bitgemüse dann als ungültig identifiziert. die wenigen dadurch zerstörten sonderzeichen im text (das echte unicode) hab ich dann über ein entsprechendes mapping wieder korrigiert und am ende wieder unicode draus erzeugt.
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
Thallius Wie parse ich dieses Datum richtig? Allgemeine Java-Themen 5
T SimpleDateFormat.parse() liefert falschen Tag Allgemeine Java-Themen 2
O Nach parse von String zu Integer verliere ich Programmablauf! Allgemeine Java-Themen 10
S Frage zu InternetAddress.parse() Allgemeine Java-Themen 5
S Parse HTML-Ausschnitt Allgemeine Java-Themen 5
H Object cast exception Allgemeine Java-Themen 5
W Queue.remove() -> no such element exception Allgemeine Java-Themen 17
urmelausdemeis Exception in thread "main" java.lang.Error: Unresolved compilation problem: Allgemeine Java-Themen 7
N Kann ich die Nullpointer Exception umgehen Allgemeine Java-Themen 12
N A java Exception has occured Allgemeine Java-Themen 8
G javafx "class path" exception Allgemeine Java-Themen 5
H Interface PluginSystem ClassNotFound exception für library Klassen Allgemeine Java-Themen 10
tom.j85 Exception bei Abfrage von Ländercodes in API? Allgemeine Java-Themen 13
S Exception Allgemeine Java-Themen 5
LimDul Streams und Exception Allgemeine Java-Themen 8
C FileLock - Exception wird immer geworfen Allgemeine Java-Themen 4
S Wertbeschränkung Exception oder Anpassung? Allgemeine Java-Themen 4
D Nullpointer Exception Problem Allgemeine Java-Themen 5
Kirby.exe Nullpointer Exception bei Queue Allgemeine Java-Themen 5
R Schlüsselworte "Throw new exception" gibt nicht den String als Fehlermeldung aus Allgemeine Java-Themen 2
P Swing Exception in thread "AWT-EventQueue-0" java.lang.IndexOutOfBoundsException: npoints > xpoints.length || npoints > ypoints.length Allgemeine Java-Themen 5
S RMI Exception Allgemeine Java-Themen 0
S MSSQL Exception & Connection String Allgemeine Java-Themen 19
S Interface, generischer Datentyp, Exception? Allgemeine Java-Themen 3
coolian warum bekomme ich ein string index out of bounds exception Allgemeine Java-Themen 17
B Aufruf der Methode ergibt eine Exception Allgemeine Java-Themen 13
S Exception in thread "main" java.lang.NullPointerException at FamilienApp.main(FamilienApp.java:15) Allgemeine Java-Themen 1
M Klassen Serializable Exception Allgemeine Java-Themen 1
E HILFE !! Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/commons/io/FileUtils Allgemeine Java-Themen 4
E Thread Exception Allgemeine Java-Themen 6
javaerd Binomialkoeffizient ausrechnen, Exception in thread "main" java.lang.StackOverflowError Allgemeine Java-Themen 6
M xlsx File auslesen Exception occured Allgemeine Java-Themen 13
X jvm exception abfangen und an externes Programm schicken Allgemeine Java-Themen 4
G Java/LibGDX File Loading Exception Allgemeine Java-Themen 2
B Exception in Application init method Allgemeine Java-Themen 5
H OOP Testen einer Exception mit JUnit Allgemeine Java-Themen 8
M javafx ComboBox- Nullpointer Exception Allgemeine Java-Themen 6
perlenfischer1984 Dialect class not found exception Allgemeine Java-Themen 15
Thallius Bekomme keine Exception mit Stacktrace mehr. Was habe ich getan? Allgemeine Java-Themen 13
perlenfischer1984 Functionsparameter prüfen und eine Exception werfen !? Allgemeine Java-Themen 11
E Probleme mit nextInt() und Exception Allgemeine Java-Themen 35
Z Exception wird nicht ausgelöst Allgemeine Java-Themen 2
0 Animiertes Gif anzeigen - NullPointer Exception Allgemeine Java-Themen 19
T Konstruktor löst exception aus Allgemeine Java-Themen 7
KilledByCheese Dezimal nach Hexadezimal rechner wirft seltsame exception Allgemeine Java-Themen 4
V Compiler-Fehler Exception in thread "AWT-EventQueue-0" java.lang.IndexOutOfBoundsException: Index: 125, Size: 125 Allgemeine Java-Themen 11
D Codeausführung bevor Exception abgeschlossen ist Allgemeine Java-Themen 11
T FileNotFound Exception Allgemeine Java-Themen 9
L Exception/Error auf JDialog umleiten Allgemeine Java-Themen 2
C Arithmetic Exception, obwohl nichts 0 ist Allgemeine Java-Themen 5
M A Java Exception has occured. Allgemeine Java-Themen 1
J Exception in thread "main" java.lang.NoClassDefFoundError Allgemeine Java-Themen 4
M Exception in thread "AWT-EventQueue-0" Allgemeine Java-Themen 6
P Input/Output java.util.Scanner in einer Schleife und Exception-Behandlung: Einlesen einer Zahl Allgemeine Java-Themen 4
E A Java Exception Has Occured Allgemeine Java-Themen 4
T Exception handling Allgemeine Java-Themen 7
P lazy loading exception Allgemeine Java-Themen 0
A Interpreter-Fehler OutOfMemory Exception mit Base64 decode Allgemeine Java-Themen 3
S Java Applet Crash - Keine Exception Allgemeine Java-Themen 8
S Best Practice verschiedene Exceptions fangen und neue Exception erzeugen Allgemeine Java-Themen 11
K Exception in thread "AWT-EventQueue-1" Allgemeine Java-Themen 2
K Gepacktes Jar-File gibt beim Doppelklick eine Exception aus Allgemeine Java-Themen 4
P Eigene Exception Klasse Allgemeine Java-Themen 7
N Java Interne Exception Allgemeine Java-Themen 4
B JUnit4 Exception-Test Allgemeine Java-Themen 4
127.0.0.1 SQL Exception, kein Driver Allgemeine Java-Themen 9
S Erste Schritte Exception beendet Schleife nicht - Methode macht trotz throw weiter? Allgemeine Java-Themen 9
R ZIP FileSystem unter Windows wirft exception Allgemeine Java-Themen 7
H java.util.Timer und Funktion mit SQL Exception Allgemeine Java-Themen 5
Ollek Barcode mit Barcode4J erzeugen - Exception Allgemeine Java-Themen 4
Z Concurrent Modification Exception - HashMap (kein remove) Allgemeine Java-Themen 4
E Eigene Exception Klasse erstellen Allgemeine Java-Themen 3
L Variablen IO Exception weil File angeblich nicht exisitert Allgemeine Java-Themen 10
T Exception versus Rückgabeparamter Allgemeine Java-Themen 26
S Exception enableDepthTest Allgemeine Java-Themen 7
M JAXB Reimport zu Hibernate DB -> Exception Allgemeine Java-Themen 3
W Kleine Frage zu Null-Pinter-Exception Allgemeine Java-Themen 21
aze JUnit: Testen ob bestimmte Exception nicht auftritt Allgemeine Java-Themen 18
S Null Pointer Exception bei BufferedReader Allgemeine Java-Themen 4
N Runtime.exec() Exception Problem Allgemeine Java-Themen 3
P Default constructor cannot handle exception type Allgemeine Java-Themen 6
M Objekt prüfen auf null ->Invocation Target Exception??? Allgemeine Java-Themen 2
S Bildaufbau durch Servlet -> Exception Allgemeine Java-Themen 11
E Queue: Wie kann hier ein null-Pointer Exception auftreten?! Allgemeine Java-Themen 11
S Exception beim Schreiben des Dataset in XML Datei Allgemeine Java-Themen 8
M Webstart Exception trotz signierten JARs Allgemeine Java-Themen 3
E Interpreter-Fehler unbekannte Exception Allgemeine Java-Themen 12
B Komische Exception Allgemeine Java-Themen 4
U SwingWorker und Exception Allgemeine Java-Themen 3
B Nullpointer Exception in Array Allgemeine Java-Themen 15
G WebService Exception Allgemeine Java-Themen 3
M Best Practices Exception Handling für eigene library Allgemeine Java-Themen 8
G PermSpace Exception Allgemeine Java-Themen 2
S Invalid Chunk Exception Allgemeine Java-Themen 3
N URLClassLoader Exception Allgemeine Java-Themen 5
Apo Java Sound Mark/Reset Exception Allgemeine Java-Themen 14
M Exception ganz sehen Allgemeine Java-Themen 2
D Problem mit EasyMock und Exception Allgemeine Java-Themen 6
B Exception wird geworfen, ich darf sie aber nicht abfangen. Allgemeine Java-Themen 10
7 Exception wird nicht aufgefangen Allgemeine Java-Themen 8

Ähnliche Java Themen

Neue Themen


Oben