Du gibst in der XML-Datei an, welche Kodierung du verwendest. An diese musst du dich natürlich halten. Nicht umsonst muss man diese Kodierung angeben.
Wenn du nicht weißt, welches Ausgangsformat vorliegt, hast du ein Problem. Eine Möglichkeit wäre es, das ganze noch mal zu kodieren, um einen wohl definierten Zeichensatz zu erhalten. Zum Beispiel über eine base46-Kodierung. Ob das dann noch in deinem Sinne sinnvoll verwendbar ist, musst du natürlich entscheiden.