Java Object das eine HTML Datei repräsentiert

PrincE

Aktives Mitglied
Hallo Java-Community,

suchfunktion und google hat mir nicht wirklich weiter geholfen.
Wie der Titel schon sagt ich suche ein Java Object das eine HTML Datei repräsentiert.

Beispiel:

Code:
<html>
<head>
<meta name="description" content="News, Test &amp; Kaufberatung zu PC, Computer, Handy und Home Entertainment." />
<meta name="keywords" content="Download, Forum, Test, News, Preisvergleich" />
<meta name="revisit-after" content="1 day" />
<meta http-equiv="content-language" content="de" />
<meta name="robots" content="noodp" />
<meta http-equiv="expires" content="900" />
<meta http-equiv="content-type" content="text/html; charset=ISO-8859-1" />
<meta property="fb:page_id" content="179800383306" />
<meta property="fb:admins" content="100001480969863"/>
</head>
<body>
qwe
</body>
</html>

Damit ich sagen kann .getHead().getElement("meta").getAttributes -> dann bekomm ich 'name','content',... ausgeben

und auch

.getHead().getElement("meta").getAttribute("name").getValue() -> dann bekomm ich 'description'.

javax.swing.text.Document hat zwar den Ansatz aber damit kommt man spätestens mit Value nicht weiter. Und auch so gibt es da Unstimmigkeiten wenn ich mehrere Beispiele nehme.

Hoffe jemand kann mir weiterhelfen
 

PrincE

Aktives Mitglied
das funktioniert nicht weil z.B. wie im Beispiel angegeben Metatags geöffnet aber für "xml" nicht geschlossen werden.
Eine Html Datei ist keine wohl geformte XML Datei
 

Guardi

Bekanntes Mitglied
Hö?
In deinem Beispiel sind die Meta-Tags ganz normale Elemente, die sich ohne weiteres als XML-Element auslesen lassen.
Wo ist das Problem?
 
G

Gast2

Gast
das funktioniert nicht weil z.B. wie im Beispiel angegeben Metatags geöffnet aber für "xml" nicht geschlossen werden.

Doch werden sie:

[c]<meta property="fb:admins" content="100001480969863"/>[/c]

Das Element meta wird ja mit /> beendet. Es hat also keine Childknoten/Content sondern nur Attribute.
 

PrincE

Aktives Mitglied
es ist ja nicht so das ich es nicht ausprobiert habe:

Datei:

HTML:
<html>
	<head>
		<meta name="keywords" content="Test, Seite">
	</head>
</html>

Code:

Java:
SAXBuilder builder = new SAXBuilder();
Document doc;
doc = builder.build("D:\\Beispiel.htm");
Element e = doc.getRootElement();
System.out.println(e.getName());

Fehler:

Code:
org.jdom.input.JDOMParseException: Error on line 5 of document file:///D:/Beispiel.htm: The element type "meta" must be terminated by the matching end-tag "</meta>".
	at org.jdom.input.SAXBuilder.build(SAXBuilder.java:530)
	at org.jdom.input.SAXBuilder.build(SAXBuilder.java:986)
	at Test.main(Test.java:48)
Caused by: org.xml.sax.SAXParseException: The element type "meta" must be terminated by the matching end-tag "</meta>".
	at com.sun.org.apache.xerces.internal.util.ErrorHandlerWrapper.createSAXParseException(Unknown Source)
	at com.sun.org.apache.xerces.internal.util.ErrorHandlerWrapper.fatalError(Unknown Source)
	at com.sun.org.apache.xerces.internal.impl.XMLErrorReporter.reportError(Unknown Source)
	at com.sun.org.apache.xerces.internal.impl.XMLScanner.reportFatalError(Unknown Source)
	at com.sun.org.apache.xerces.internal.impl.XMLDocumentFragmentScannerImpl.scanEndElement(Unknown Source)
	at com.sun.org.apache.xerces.internal.impl.XMLDocumentFragmentScannerImpl$FragmentContentDriver.next(Unknown Source)
	at com.sun.org.apache.xerces.internal.impl.XMLDocumentScannerImpl.next(Unknown Source)
	at com.sun.org.apache.xerces.internal.impl.XMLNSDocumentScannerImpl.next(Unknown Source)
	at com.sun.org.apache.xerces.internal.impl.XMLDocumentFragmentScannerImpl.scanDocument(Unknown Source)
	at com.sun.org.apache.xerces.internal.parsers.XML11Configuration.parse(Unknown Source)
	at com.sun.org.apache.xerces.internal.parsers.XML11Configuration.parse(Unknown Source)
	at com.sun.org.apache.xerces.internal.parsers.XMLParser.parse(Unknown Source)
	at com.sun.org.apache.xerces.internal.parsers.AbstractSAXParser.parse(Unknown Source)
	at com.sun.org.apache.xerces.internal.jaxp.SAXParserImpl$JAXPSAXParser.parse(Unknown Source)
	at org.jdom.input.SAXBuilder.build(SAXBuilder.java:518)
	... 2 more
Caused by: org.xml.sax.SAXParseException: The element type "meta" must be terminated by the matching end-tag "</meta>".
	at com.sun.org.apache.xerces.internal.util.ErrorHandlerWrapper.createSAXParseException(Unknown Source)
	at com.sun.org.apache.xerces.internal.util.ErrorHandlerWrapper.fatalError(Unknown Source)
	at com.sun.org.apache.xerces.internal.impl.XMLErrorReporter.reportError(Unknown Source)
	at com.sun.org.apache.xerces.internal.impl.XMLScanner.reportFatalError(Unknown Source)
	at com.sun.org.apache.xerces.internal.impl.XMLDocumentFragmentScannerImpl.scanEndElement(Unknown Source)
	at com.sun.org.apache.xerces.internal.impl.XMLDocumentFragmentScannerImpl$FragmentContentDriver.next(Unknown Source)
	at com.sun.org.apache.xerces.internal.impl.XMLDocumentScannerImpl.next(Unknown Source)
	at com.sun.org.apache.xerces.internal.impl.XMLNSDocumentScannerImpl.next(Unknown Source)
	at com.sun.org.apache.xerces.internal.impl.XMLDocumentFragmentScannerImpl.scanDocument(Unknown Source)
	at com.sun.org.apache.xerces.internal.parsers.XML11Configuration.parse(Unknown Source)
	at com.sun.org.apache.xerces.internal.parsers.XML11Configuration.parse(Unknown Source)
	at com.sun.org.apache.xerces.internal.parsers.XMLParser.parse(Unknown Source)
	at com.sun.org.apache.xerces.internal.parsers.AbstractSAXParser.parse(Unknown Source)
	at com.sun.org.apache.xerces.internal.jaxp.SAXParserImpl$JAXPSAXParser.parse(Unknown Source)
	at org.jdom.input.SAXBuilder.build(SAXBuilder.java:518)
	at org.jdom.input.SAXBuilder.build(SAXBuilder.java:986)
	at Test.main(Test.java:48)
Caused by: org.xml.sax.SAXParseException: The element type "meta" must be terminated by the matching end-tag "</meta>".
	at com.sun.org.apache.xerces.internal.util.ErrorHandlerWrapper.createSAXParseException(Unknown Source)
	at com.sun.org.apache.xerces.internal.util.ErrorHandlerWrapper.fatalError(Unknown Source)
	at com.sun.org.apache.xerces.internal.impl.XMLErrorReporter.reportError(Unknown Source)
	at com.sun.org.apache.xerces.internal.impl.XMLScanner.reportFatalError(Unknown Source)
	at com.sun.org.apache.xerces.internal.impl.XMLDocumentFragmentScannerImpl.scanEndElement(Unknown Source)
	at com.sun.org.apache.xerces.internal.impl.XMLDocumentFragmentScannerImpl$FragmentContentDriver.next(Unknown Source)
	at com.sun.org.apache.xerces.internal.impl.XMLDocumentScannerImpl.next(Unknown Source)
	at com.sun.org.apache.xerces.internal.impl.XMLNSDocumentScannerImpl.next(Unknown Source)
	at com.sun.org.apache.xerces.internal.impl.XMLDocumentFragmentScannerImpl.scanDocument(Unknown Source)
	at com.sun.org.apache.xerces.internal.parsers.XML11Configuration.parse(Unknown Source)
	at com.sun.org.apache.xerces.internal.parsers.XML11Configuration.parse(Unknown Source)
	at com.sun.org.apache.xerces.internal.parsers.XMLParser.parse(Unknown Source)
	at com.sun.org.apache.xerces.internal.parsers.AbstractSAXParser.parse(Unknown Source)
	at com.sun.org.apache.xerces.internal.jaxp.SAXParserImpl$JAXPSAXParser.parse(Unknown Source)
	at org.jdom.input.SAXBuilder.build(SAXBuilder.java:518)
	at org.jdom.input.SAXBuilder.build(SAXBuilder.java:986)
	at Test.main(Test.java:48)
 
Zuletzt bearbeitet:
G

Gast2

Gast
Du hast da ja auch einen Fehler drin:

HTML:
<meta id = 't' name='keywords' content='Webspell-Templates, [...], Spraylogos'>

sollte:

HTML:
<meta id = 't' name='keywords' content='Webspell-Templates, [...], Spraylogos'/>

sein.

Und die table und body schließenden Tags sind auch fehlerhaft. Da fehlt das >
 

PrincE

Aktives Mitglied
Du hast da ja auch einen Fehler drin:

HTML:
<meta id = 't' name='keywords' content='Webspell-Templates, [...], Spraylogos'>

sollte:

HTML:
<meta id = 't' name='keywords' content='Webspell-Templates, [...], Spraylogos'/>

sein.

Und die table und body schließenden Tags sind auch fehlerhaft. Da fehlt das >



ja ich hab jetzt mal ein einfacheres Beispiel genommen^^ die '>' sind irgendwie anders weggekommen.
Mit dem neuem Beispiel welches ich oben im comment editiert habe, bleibt die Fehlermeldung gleich.

Das Problem ist <meta /> ist XHtml.
Zum Beispiel wenn ich SELFHTML 8.1.2 (HTML-Dateien selbst erstellen) benutzen würde
die nur HTML benutzen da ist <meta > angesagt was bedeutet das diese mit Sax ein Fehler erzeugen würden.
 

XHelp

Top Contributor
Das Problem ist <meta /> ist XHtml.

Warum soll es ein Problem sein? Du verlinkst doch selber auf selfhtml:
Wenn Sie XHTML-Standard-konform arbeiten, müssen Sie das meta-Element als inhaltsleer kennzeichnen. Dazu notieren Sie das alleinstehende Tag in der Form <meta name="Eigenschaft" content="Wert" />.

Nachtrag: ah... hab das 2. "ist" überlesen
 
Zuletzt bearbeitet:

PrincE

Aktives Mitglied
Also sind die Seiten mit denen du arbeitest nicht XHTML-konform?
Oder möchtest du keine Konformität erreichen müssen (auf den Grund bin ich gespannt).

Hä? Darum geht es doch garnicht. Ich möchte gerne alle Formen und Arten erreichen können und da diese Art und Weise mit SAX nur mit XHtml funktioniert reicht diese nicht?!
 

PrincE

Aktives Mitglied
Siehe mein Nachtrag.

Geht es dir nur darum die Meta-Daten auszulesen? Da könnte auch RegEx helfen

ja darüber habe ich auch schon nachgedacht. Ich dachte aber es gibt die Möglichkeit die ganze Page in ein Java Object zu konvertieren um damit mehr Möglichkeiten zu haben.
Theoretisch möchte ich weit aus mehr als Metatags..
 
G

Gast2

Gast
Ja, leider sind viele Browser viel zu gnädig und kaum einer bemüht sich seine Seiten mal zu validieren.
 

PrincE

Aktives Mitglied
Jsoup schafft es beide schreibweisen zu verstehen und normiert diese sogar!
jsoup Library ist genau das was ich wollte. Danke euch.
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
"java.util.HashMap.get(Object)" is null Java Basics - Anfänger-Themen 10
HolyFUT JSON String in Java Object schreiben - Anführungszeichen rauskriegen? Java Basics - Anfänger-Themen 17
M Java Klasse Object Java Basics - Anfänger-Themen 5
G Java Object value und entity? Java Basics - Anfänger-Themen 2
T List in java.lang.Object... einfügen Java Basics - Anfänger-Themen 12
H archive vergleichbarer Paramter unter Tag Object mit Parameter codetype="application/java-vm" Java Basics - Anfänger-Themen 3
M Number object in java ? Java Basics - Anfänger-Themen 8
M Vector <Object> () in Java 6 Java Basics - Anfänger-Themen 9
D flash object mit JS definieren.auch für Java Applet? Java Basics - Anfänger-Themen 13
H .java Dateien in Eclipse einbinden und ausführen Java Basics - Anfänger-Themen 1
onlyxlia Schlüsselworte Was meint man mit "einen Typ" in Java erstellen? Java Basics - Anfänger-Themen 2
O Java Kara geschweifte Klammern Java Basics - Anfänger-Themen 2
richis-fragen Mausrad logitech kann links und rechts klick wie in java abragen. Java Basics - Anfänger-Themen 15
XWing Java Klssenproblem Java Basics - Anfänger-Themen 4
R Umgebungsvariable java -cp gibt immer Java-Hilfe... Java Basics - Anfänger-Themen 3
farbenlos Csv Datei in Java einlesen Java Basics - Anfänger-Themen 18
F TableModelListener: java.lang.ArrayIndexOutOfBoundsException: 132 Java Basics - Anfänger-Themen 3
G Java 8 - Support-Ende Java Basics - Anfänger-Themen 7
T Java Weihnachtsbaum + Rahmen Java Basics - Anfänger-Themen 1
N Will mit Java anfangen Java Basics - Anfänger-Themen 13
Ü Java Array - Buchstaben als Zahlen ausgeben Java Basics - Anfänger-Themen 22
M Java Iterator Verständnisfrage Java Basics - Anfänger-Themen 6
M Java Mail Programm Java Basics - Anfänger-Themen 4
Sniper1000 Java 391 für Windows Java Basics - Anfänger-Themen 37
J Java long- in int-Variable umwandeln Java Basics - Anfänger-Themen 6
JaZuDemNo Java im Studium Java Basics - Anfänger-Themen 7
E Java Programm zur anzeige, ob Winter- oder Sommerzeit herrscht Java Basics - Anfänger-Themen 62
I QR code in Java selber generieren Java Basics - Anfänger-Themen 5
V Java-Ausnahmebehandlung: Behandlung geprüfter Ausnahmen Java Basics - Anfänger-Themen 1
krgewb Java Streams Java Basics - Anfänger-Themen 10
A Überwältigt von der komplexen Java Welt Java Basics - Anfänger-Themen 29
O Mehrfachvererbung auf Spezifikations- und Implementierungsebene in Java. Interfaces Java Basics - Anfänger-Themen 19
John_Sace Homogene Realisierung von Generics in Java ? Java Basics - Anfänger-Themen 19
P Meldung aus Java-Klasse in Thread an aufrufende Klasse Java Basics - Anfänger-Themen 1
R mit Java API arbeiten Java Basics - Anfänger-Themen 9
P JDK installieren Probleme bei der Java-Installation Java Basics - Anfänger-Themen 8
S Java: Wie sortiere ich eine ArrayList benutzerdefinierter Objekte nach einem bestimmten Attribut? Java Basics - Anfänger-Themen 2
Timo12345 JNLP File mit Java öffnen Java Basics - Anfänger-Themen 2
S Video Editierung mit Java.._ Java Basics - Anfänger-Themen 2
F Einstelungen in Java - CursorBlinkRate Java Basics - Anfänger-Themen 10
A PHP $_POST["name"] in Java Java Basics - Anfänger-Themen 3
vivansai21 Is there a oneliner to create a SortedSet filled with one or multiple elements in Java? Java Basics - Anfänger-Themen 9
Athro-Hiro Weißes Bild in Java erstellen Java Basics - Anfänger-Themen 3
Arjunreddy Can someone please tell me how to use a debugger in BlueJ(a Java environment) Java Basics - Anfänger-Themen 1
M Java assoziationen (UML) Java Basics - Anfänger-Themen 8
H Excel-Tabellen mit Java erstellen Java Basics - Anfänger-Themen 4
Simon16 Java ArrayListe von einer Klasse sortieren Java Basics - Anfänger-Themen 2
P Wie kann ich in meinem Java Programm etwas dauerhaft speichern? Java Basics - Anfänger-Themen 5
H Nutzt Eclipse alle CPU-Threads beim Ausführen von Java-Programmen? Java Basics - Anfänger-Themen 4
xXGrowGuruXx Java einstieg, leichte sache 0 verstanden Java Basics - Anfänger-Themen 7
A java.sql.SQLException: Data type mismatch. Java Basics - Anfänger-Themen 1
H Java-Programm zur Ausgabe von Zuständen Java Basics - Anfänger-Themen 80
N Java Spiel Figur auf dem Hintergrundbild bewegen. Java Basics - Anfänger-Themen 11
G Kann Java-Programm nicht als jar aufrufen, auch als EXE nicht Java Basics - Anfänger-Themen 19
N Java Taschenrechner hat Jemand vlt einen Tipp dafür wie ich jetzt die buttons verbinden kann und das Ergebnis auf dem textfield anzeigen lassen kann Java Basics - Anfänger-Themen 13
A Lerngruppe Java Java Basics - Anfänger-Themen 2
G Help me in the Java Program Java Basics - Anfänger-Themen 2
L Java- Vererbung Java Basics - Anfänger-Themen 4
LimDul Suche Java Stream Tutorial Java Basics - Anfänger-Themen 2
_so_far_away_ Ich möchte Java lernen Java Basics - Anfänger-Themen 11
benny1993 Java Programm erstellen für ein Fußball-Turnier Java Basics - Anfänger-Themen 3
M Datentypen While-Schleife eine Java Methode erstellen Java Basics - Anfänger-Themen 3
V Bild per Java Script austauschen Java Basics - Anfänger-Themen 7
MoxMorris this Keyword in Java Java Basics - Anfänger-Themen 14
D Wie kann man in Java nach Arrays auf Duplikate prüfen Java Basics - Anfänger-Themen 12
wolei JAVA Zeitdifferenz feststellen. Java Basics - Anfänger-Themen 4
DiyarcanZeren Rekursion in Java Java Basics - Anfänger-Themen 5
wolei Java generic interface in a generic class Java Basics - Anfänger-Themen 6
monsterherz Ablauf der Erstellung eines Java Programmes Java Basics - Anfänger-Themen 17
monsterherz Circle.java:5: error: <identifier> expected Java Basics - Anfänger-Themen 2
julian-fr Wie kann ich am besten Java lernen? Java Basics - Anfänger-Themen 17
A Java-Properties und -RessourceBundles Java Basics - Anfänger-Themen 5
lrnz22 Java-Basics-Aufgabe Java Basics - Anfänger-Themen 8
R Java kann nicht installiert werden Java Basics - Anfänger-Themen 8
marcelnedza Finde meinen Fehler in einer Methode nicht, Java Karol Java Basics - Anfänger-Themen 15
G In ein java Dokument Ton einbinden Java Basics - Anfänger-Themen 1
C was heisst es wenn java ']' erwartet ? Java Basics - Anfänger-Themen 2
KeinJavaFreak Erste Schritte Programm "Java(TM) Platform SE binary " nicht vorhanden Java Basics - Anfänger-Themen 1
KeinJavaFreak Erste Schritte Java "Executable Jar File" nicht vorhanden Java Basics - Anfänger-Themen 1
melisax Java 2D-Array Tabelle Java Basics - Anfänger-Themen 4
melisax Java Array Wert an bestimmtem Index angeben Java Basics - Anfänger-Themen 14
J Java Testklasse Java Basics - Anfänger-Themen 5
P Java Selenium . Parameterized.Parameters erzeugt eine Fehlermeldung Java Basics - Anfänger-Themen 14
W Java-Code mit Array Java Basics - Anfänger-Themen 14
W Java-Code Java Basics - Anfänger-Themen 2
P BeforeEach AfterEach werden nicht ausgeführt. Java / Selenium Java Basics - Anfänger-Themen 4
A Wie führe ich eine Batch-Datei von meiner Java-Anwendung aus? Java Basics - Anfänger-Themen 18
W Java code- TicTac toe Java Basics - Anfänger-Themen 51
Ostkreuz Java Docs Java Basics - Anfänger-Themen 9
R Java boolean Unterschied " == " und " = " Java Basics - Anfänger-Themen 3
D Java Programm mit Batch-Datei starten Java Basics - Anfänger-Themen 32
W Java-code Java Basics - Anfänger-Themen 8
W Java-code Java Basics - Anfänger-Themen 9
W Java-Code erklären Java Basics - Anfänger-Themen 6
A Java Kurs / Tutorial Java Basics - Anfänger-Themen 6
K Java Lotto Spiel; ich komme nicht weiter Java Basics - Anfänger-Themen 15
R Operatoren Rechenoperation in Java verwenden für Calculator Java Basics - Anfänger-Themen 2
P Java 2n Potenzieren Java Basics - Anfänger-Themen 1
J Java Hamster Java Basics - Anfänger-Themen 4
D Wie sehe ich ein Java-Programm? Java Basics - Anfänger-Themen 27

Ähnliche Java Themen

Neue Themen


Oben