org.w3c.Document -> meta

DonMarcoHH

Aktives Mitglied
Moin,

ich suche eine Prozedur um aus einem Document alle tags mit dem Namen "meta" rauszukriegen.

also alle tags dieser Form:
Code:
<meta name="title" content="Java ist auch eine Insel - Programmieren für die Java 2-Plattform in der Version 5, 5. Auflage, Galileo Computing, ISBN 3-89842-747-1">

Eigentlich brauche ich hierbei nur die Informationen aus name= und aus content=

Ich hab folgende Funktion ausprobiert, die hat aber nur eine leere Liste zurückgegeben....:
Java:
NodeList meta = doc.getElementsByTagName("meta");

Weiss jemand Rat?
 

F.S.WhiTeY

Bekanntes Mitglied
Warum da nix zurückkommt kann ich dir nicht sagen, aber warum schreibst du dir nicht selber ne kleine klasse um das auszulesen ?

Braucht doch nur nen Filereader und ne methode die Zeilenweise prüft wo so ein tag enthalten ist.

zudem kommt noch hinzu, wenn es ein normales html oder xhtml dokument ist, das die metatags immer im headbereich sind.
also musst du lediglich zwischen <head> und </head> prüfen.

den rest machst du mit regular expressions beim string prüfen, da es vorkommen kann das zwei metatags in einer zeile stehen.

hth

WhiTeY
 

F.S.WhiTeY

Bekanntes Mitglied
ob nun nen html, w3c, xml, xhtml oder txt dokument. herangehen kannste da immer auf die selbe weise:

Java:
BufferedReader in = new BufferedReader(
  new InputStreamReader(  new FileInputStream("Pfad_zum_Dokument")));
try {
  String zeile;
  while((zeile = in.readLine()) != null) {

       //Hier prüfen ob zeile metatag ist oder nicht am besten mit regex
  }
} finally {
  in.close();
}
 

DonMarcoHH

Aktives Mitglied
ob nun nen html, w3c, xml, xhtml oder txt dokument. herangehen kannste da immer auf die selbe weise:

Java:
BufferedReader in = new BufferedReader(
  new InputStreamReader(  new FileInputStream("Pfad_zum_Dokument")));
try {
  String zeile;
  while((zeile = in.readLine()) != null) {

       //Hier prüfen ob zeile metatag ist oder nicht am besten mit regex
  }
} finally {
  in.close();
}

Ich weiss schon wie ich Dokument einlese und öffne.
Ich kriege aber kein Dokument, sondern ich kriege den Java Typen org.w3c.Document geliefert (darauf habe ich keinen Einfluss) und muss aus diesem DOM Baum nun die Meta-Tags rausfiltern!
Normalerweise würde ich das mit obiger Methode machen, die Textelemente hole mich mir ja auch mit Node.getNodeType() == Node.TEXT_NODE... sowas gibts nur leider nicht für Meta-Tags...

Deswegen meine Frage!
 

F.S.WhiTeY

Bekanntes Mitglied
gut, nachdem ich mir mal die api zu org.w3c.dom.document angesehen habe kann ich sagen das deine zeile recht gut aussieht.

nun gibt es zwei möglichkeiten.
1. du debugst das ganze und schaust dir die variablenwerte an
2. du machst als parameter für den tagname einfach mal "*" und schaust ob in dem "dokument" überhaupt nen meta dabei ist. ergo lass dir die nodelist so ausgeben das du die strings bekommst. Nen blick in die API sagt dir auch wie die nodes aufgebaut sind.
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
E Pdf-Document lässt sich im Servlet nicht öffnen Java Basics - Anfänger-Themen 5
K Java iText: The document has no pages. Java Basics - Anfänger-Themen 9
D Elements[] string = document.getElementsByClass("betEvent"); als Array Java Basics - Anfänger-Themen 1
P XML Document to String Java Basics - Anfänger-Themen 4
D org.w3c.Document -> Text Java Basics - Anfänger-Themen 2
Developer_X Txt Document laden inhalt löschen und anderen text rein und wieder speichern Java Basics - Anfänger-Themen 36
Developer_X Txt Document laden aus dem Internet Java Basics - Anfänger-Themen 12
Schandro RTF Document mit BufferedImages erstellen Java Basics - Anfänger-Themen 3
G import Document Java Basics - Anfänger-Themen 2
A Einsteiger/ In Document schreiben Java Basics - Anfänger-Themen 9
A .txt document einfügen in arrayList Java Basics - Anfänger-Themen 4
G String in Document Umwandeln Java Basics - Anfänger-Themen 2
P Inhalt von org.w3c.dom.Document in String Variable speichern Java Basics - Anfänger-Themen 3
T JDOM - Document build aus byteArray? Java Basics - Anfänger-Themen 5
O problem mit document listener finde den fehler nicht Java Basics - Anfänger-Themen 2
I Meta Tags vergleichen mit Html Vorgabe Java Basics - Anfänger-Themen 8
F META-INF/persistence.xml in einer war-Datei Java Basics - Anfänger-Themen 6

Ähnliche Java Themen

Neue Themen


Oben