xhtml Dateien splitten via DOM Tree

DavidRei · 1. Jun 2010

Hallo, ich sitz nun seit ca 2 Wochen an folgendem Problem:
Ich habe ein von mir erstelltes epub, nun darf in dem epub jede xhtml Datei maximal 300kB betragen. Ich soll jede xhtml Datei auf ihre Größe überprüfen und immer bei einer Überschrift (H1, H2, etc) sollte die Datei größer 300kB sein cutten. Das einzige was ich weiss ist dass es die beste Lösung wäre die xhtml Dateien über den DOM Tree zu bearbeiten. Ich hab nur leider nicht den blassesten Schimmer wie ich das anstellen soll. Kann ich da einfach im DOM Tree nach einer H1, etc suchen den bereich rausschneiden und in eine neu erzeugte Datei einfügen oder geht das ganze auch anders.
mfg David

oldshoe · 6. Jun 2010

Hmmm...was ist eigentlich ein epub?
Aber mal zur Topic: So richtig verstehe ich das noch nicht.
Nehmen wir mal an wir haben eine xhtml-Datei die größer ist als 300kB. Wird dann vorrausgesetzt, dass da auch wirklich immer Überschriften (H1 usw. ) drin sind?
Also einfach cutten ist kein Problem, aber dann hast du halt mehrere fehlerhafte xhtml dateien, da sich z.B. der body-tag nicht mehr schließt...oder ist das kein Problem? Würde das mit Regex lösen. Einfach nach H-tags mit dem Pattern

Java:

"<H\\d>.*?</H\\d>"

suchen und dann davor oder danach abschneiden. Also mit dem Pattern die Überschriften extrahieren, dann mit indexOf() die Länge des Strings bis zur Überschrift erkennen und alles davor und danach mit substring als neuen string speichern.

Ich glaub das klingt nicht einfach, ist es aber eigentlich schon. Also frag einfach und/oder poste dein Codebeispiel.

DavidRei · 9. Jun 2010

Also schwer hört es sich nicht an aber da ich als armer Student vorgeschrieben bekomme wie ich es machen mmuss sind mir da etwas die Hände gebunden :-(

Und ja, es ist immer eine Hx Überschrift da... naja trotzdem Danke für die Idee

	Titel	Forum	Antworten	Datum
C	javascript in .html Funktioniert, in .xhtml nicht mehr	XML & JSON	0	23. Aug 2017
	Probleme beim Parsen von XHTML-Datei	XML & JSON	4	20. Aug 2006
X	XML/XHTML und Namespaces	XML & JSON	2	30. Nov 2005
	Eingabefelder von Excel Dateien auslesen	XML & JSON	1	7. Apr 2018
	Excel Dateien über Dropbox zugreifen	XML & JSON	0	16. Mrz 2018
T	Visualisierung von XML Dateien in einer Java SwingGui	XML & JSON	11	5. Sep 2014
D	Große XML-Datei in einzel Dateien splitten	XML & JSON	3	30. Jul 2014
A	Elemente aus mehreren XML-Dateien zu einem zusammenfügen	XML & JSON	5	5. Sep 2011
X	JDom für SOAP Dateien geeignet?	XML & JSON	3	27. Apr 2011
L	compareto(), equals() in JAXB generierten Dateien	XML & JSON	3	14. Sep 2010
M	Zwei XML-Dateien joinen	XML & JSON	3	25. Aug 2010
F	XML unerlaubte Zeichen aus Dateien entfernen	XML & JSON	9	9. Feb 2010
E	JDOM - Problem beim Zusammenfügen zweier Dateien	XML & JSON	2	15. Okt 2009
	-xlsx Dateien in Java lesen	XML & JSON	3	7. Jul 2009
Y	xmlbeans und DTD Dateien	XML & JSON	2	4. Mai 2009
S	Vergleichen von 2 XML Dateien	XML & JSON	2	24. Apr 2009
H	XML-Datei in einzelne XML-Dateien zerlegen	XML & JSON	2	8. Sep 2008
P	XML Dateien zusammenführen und in eine XML speichern	XML & JSON	7	7. Nov 2007
I	RDF Dateien	XML & JSON	3	28. Mai 2005
S	XMl Dateien in Java schreiben	XML & JSON	4	23. Mai 2005
M	[JSON] Wie Splitten?	XML & JSON	14	28. Sep 2011

xhtml Dateien splitten via DOM Tree

DavidRei

Mitglied

oldshoe

Bekanntes Mitglied

DavidRei

Mitglied

Ähnliche Java Themen

Aktuelle Jobs

Neue Themen