Bestimmte Zeilen aus einer HTML Datei lesen

Status
Nicht offen für weitere Antworten.

Ollek

Bekanntes Mitglied
Hallo,

wie kann ich in java folgendes verwirklichen.
Ich habe eine Datei mit vielen Zeilen, diese lese ich ein und speicher diese in einer ArrayList. Aber ich möchte jetzt nur bestimmte zeilen auslesen. Von Zeile Start bis Zeile Ende. Wie bekomme ich das hin, dort laufe ich momentan in einem Tunnel rum, wo ich kein Licht sehe.
Schön wäre eine Zeile Start(z.B. <title> , Steht jetzt in der ersten Zeile, welche ich auslesen möchte) und ein Ende (z.B. letztes meta im Text oder <meta name= ). Und der soll die kompletten Zeilen zwischen der Startzeile und der Endzeile lesen und im Array speichern. Dort bleibe ich momentan hängen.
Habe jetzt schon 3 IndexOf Variabeln aber damit komme ich auch nicht an den kompletten Text zwischen Startzeile und Endzeile.
Nicht in jeder Zeile steht ein <meta >.

Meine Methode, die ich geschrieben habe sieht so aus:

Java:
/*	 function copyMetaTags(String arg0)
	 * 
	 * 	 string arg0 = Zeile, welche momentan in der datei durchlaufen wird
	 * 
	 * 	 Die Funktion copyMetaText, untersucht die übergebende Datei nach den Meta-Zeilen.
	 * 	 Speichert diese in einer ArrayList.
	 * 
	 */
	public String copyMetaTags(String strZeile){
		int iStartIndex = strZeile.indexOf("<title>");
		int iMetaIndex = strZeile.indexOf("<meta ");
		int iEndIndex = strZeile.indexOf("<meta name=\"rating\" content=\"general\" />");
		String metaZeile = null;
		if(iStartIndex != -1){
			metaZeile = strZeile.substring(iStartIndex);
		}else if (iMetaIndex != -1){
			metaZeile = strZeile.substring(iMetaIndex);
		}
		if(iEndIndex != -1){
			metaZeile = strZeile.substring(iEndIndex);
		}
		return metaZeile;
	}// close copyMetaTags

Besten Gruß

Ollek
 

Ollek

Bekanntes Mitglied
Ach Mensch, das ja blöde... dann muss ich jetzt mal überlegen wie ichs anders machen kann ;(
 

Ollek

Bekanntes Mitglied
Sind leider nicht immer die gleichen Zeilennummern.

Wie kann man den sonst son Dokument zerlegen? Daran happerts halt bei mir noch.. Sonst wäre alles fertig :-(
 

Ollek

Bekanntes Mitglied
ich habe das nun mit den zeilen ausprobiert... Habe die Zeilen nun von Start(wo ich anfangen muss zu lesen) bis Ende(wo ich aufhören muss mit dem lesen).

Wie kriege ich es nun hin, dass readLine() wieder dort anfängt, wo ich die Startzeile habe. Weil wenn ich die Zeilen durch eine for-Schleife auslesen möchte startet er hinter der Ende-Zeile und liest dort solange weiter bis Start = Endzeile ist. Normalerweise soll er ja dann den Cursor wieder an die Startzeile setzen, diese übergebe ich ja durch die int variable.

Hoffe die Problemstellung ist verständlich ;-)
 

pexx

Mitglied
wenn ich dich richtig verstehe möchtest du meta-informationen aus einer html datei auslesen?

warum liest du die datei nicht komplett in einen string ein (inkl. den nicht-druckbaren-zeichen) und wendest reguläre ausdrücke an? find ich am praktikabelsten.

Java:
	Pattern p = Pattern.compile("<meta(.+?)/>");		
		
	ArrayList <String> metatags = new ArrayList <String>();
		
	Matcher m = p.matcher(bla);
		
	while (m.find()) 
		metatags.add(m.group(1));

ich übernehme keine garantie :D
 
Zuletzt bearbeitet:

Ollek

Bekanntes Mitglied
Leider beschränken sich die zeilen die ausgelesen werden müssen nicht nur auf "<meta"
Sondern noch auf andere Sachen.. Ich füge die HTML-Datei mit ein und makiere welche Bereiche ausgelesen werden müssen....

HTML:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
<head>
=================================================================
Erster Teil für eine HTML Datei
=================================================================
  [B]  <title>| Mode | Damen | Herren | Minis | Kids | Babies</title>
    <!-- OES - 04.03.2009 v.3 -->
    <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" />
    <meta name="language" content="de" />
    <meta name="keywords" content="Mode, Damen, Herren, Minis, Kids, Babies/>
    <meta name="description" content="Hier wird was beschrieben" />
    <meta name="page-topic" content="Mode, Damen, Herren, Minis, Kids, Babies />
    <meta name="page-type" content="Online-Shop, Online-Shopping, Mode" />
    <meta name="audience" content="all" />
    <meta name="robots" content="index, follow" />
    <meta name="revisit-after" content="7 days" />
    <meta name="author" content="Author" />
    <meta name="copyright" content=" Text " />
    <meta name="distribution" content="global" />
    <meta name="classification" content="Online-Shop, Online-Shopping, Mode, Damen, Herren" />
    <meta name="rating" content="general" />[/B]
=====================ENDE========================================
    <link rel="shortcut icon" href="" />
    
    <link rel="stylesheet" type="" />
    <link rel="stylesheet" type="" />
     
    <!-- Javascripts -->
    <script type="text/javascript" src=""></script>
    <script type="text/javascript" src=""></script>
    noch weitere Javascripts....
    .....
    ......



    <!-- Coremetrics Javascripts -->
    <script type="text/javascript" src=""></script>
     noch weitere Javascripts....
    .....
    ......

</head>
<body>
    <div id="container">
        <div id="wrap">

            <script type="text/javascript">
        // <![CDATA[
          cmSetProduction();
          cmCreatePageviewTag( "Home", null);
        // ]]>
            </script>

            <div id="header">
                <h1 class="print_hide">
                    
            </div>
            <hr class="hidden" />
            <div id="crumb">
                <ul id="navi_crumb" class="navi">
                    
                        <h2>
                            Online Angebote</h2>
                    </li>
                </ul>
            </div>
            <hr class="hidden" />
            <div id="homepage">
                <div id="content_wrap_2">
                    <div id="page_content">
                        <!-- Text -->
                        <div id="page_content_left">
                            <div class="left_box">
===================== TEIL FÜR DIE 2. HTML - Datei =====================
   [B]                             <p>
                                    <span class="title_rot_bold">Online Angebote </span>
                                    <br />
                                    <br />
                                    <span>
                                    Text
                                     ......
                                    </span>
                                    <br />
                                    <br />
Irgendein Text steht hier:
.
.
.
.
.
.
.
.
.
.
.
.
.
                                    <br />
                                    <br />
                                    <a onclick="location='                                         style="border-style: none" /></a>
                                    <br />
                                    <br />
                                </p>[/B]
=================================== ENDE =========================
                            </div>
                            <div class="left_box">
                                <p>
                                    <span class="title_rot_bold">Online Verzeichnis</span>
                                    <br />
                                    <br />
                                    Hier sind auch wieder Links......
                                    <br />
                                    <br />
                                </p>
                            </div>
                        </div>
                        <!-- Verlinkungen / Keyword Cloud -->
                        <div id="page_content_right">
                            <div class="right_box">
                               
                            Hier steht normalerweise noch mehr Text...       
                            <div class="right_box">
================== Teil für die 3. HTML- Datei ==========================
                                <p>
                                    <span class="title_rot_bold">Aktuelle Suchen</span>
                                    <br />
                                    <br />
                                    <a href="#"></a><br />
                                    <a href="#">Reisen</a><br />
                                    <a href="#">Mode</a><br />
                                    <a href="#"> W&auml;sche</a><br />
                                    <a href="#">Mode und Kleidung</a><br />
                                    <a href="#">Mode und Kleidungen</a><br />
                                    <a href="#">Kleid und Kleider</a><br />
                                    <a href="#">Mode f&uuml;r Herren und Damen</a><br />
                                    <a href="#">Mode f&uuml;r junge Damen</a><br />
                                    <a href="#">Junge Mode f&uuml;r Damen</a><br />
                                    <a href="#">Klassische Mode f&uuml;r Damen</a><br />
                                    <a href="#">Babies Mode</a><br />
                                    <a href="#">Minis Mode</a><br />
                                    <a href="#">Kids Mode</a><br />
                                    <a href="#">Girls Mode</a><br />
                                    <a href="#">Damen-Mode</a><br />
                                    <a href="#">Herren-Mode</a><br />
                                    <a href="#">Wohnen</a><br />
                                    <a href="#">Accessoires</a><br />
                                    <a href="#">Online-Mode</a><br />
                                    <a href="#">Mode Online-Shop</a><br />
                                    <a href="#">Online Shop</a><br />
                                    <a href="#">Online Shopping</a><br />
                                    <a href="#">Mode Online Angebote</a><br />
                                    <a href="#">Kleidung online einkaufen</a><br />
                                    <a href="#"> Online Shop</a><br />
                                    <a href="#">Mode</a><br />
                                    <a href="#"> Accessoires</a><br />
                                    <a href="#">Mode Accessoires</a><br />
                                    <a href="#">Sch&ouml;ne Kleidung</a><br />
                                    <a href="#">Online einkaufen</a><br />
                                    <a href="#">Online Kleidung kaufen</a><br />
                                    <br />
                                </p>
================================= ENDE ===========================
                            </div>
                        </div>
                    </div>
                </div>
                <hr class="hidden" />
            </div>
            <div class="clear">
            </div>
            <hr class="hidden" />
            <div id="footer_2">
              .
.
.
.
.
..
.
.
hier steht noch mehr Text
</body>
</html>

So ich habe die HTML Datei allerdings ziemlich gekürtzt und nur die Sachen drin gelassen ,welche ich dort rausfiltern muss und in eine neue Datei speichern muss.. Hierdurch wird das Problem eventuell deutlicher.....

Gruss
 
Zuletzt bearbeitet:
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
P Bestimmte Zeilen einer Datei ermitteln ? Java Basics - Anfänger-Themen 30
G JTextArea: nur bestimmte Zeilen anders formatieren Java Basics - Anfänger-Themen 7
B Input/Output bestimmte Zeilen in .txt Dateinen überschreiben Java Basics - Anfänger-Themen 20
T Bestimmte Zeilen aus ASCII File löschen? Java Basics - Anfänger-Themen 2
V Aus mehreren Zeilen bestimmte Teile auslesen Java Basics - Anfänger-Themen 8
S In JTable nur bestimmte Zeilen einfärben Java Basics - Anfänger-Themen 2
X readLine(): nur bestimmte Zeilen lesen Java Basics - Anfänger-Themen 7
B Alle Zahlen finden, die 3 bestimmte Ziffern enthalten? Java Basics - Anfänger-Themen 9
S Bestimmte werte aus einem Array löschen Java Basics - Anfänger-Themen 2
K loop pausieren für eine bestimmte Anzahl? Java Basics - Anfänger-Themen 1
Cassy3 Binäre Bäume Rekursiv durchlaufen und bestimmte Elemente Zählen Java Basics - Anfänger-Themen 6
Schniffi Nur bestimmte Bilder aus einem Array auf Image Button anzeigen lassen Java Basics - Anfänger-Themen 3
W Bestimmte Zahlen bei Math.random ausschließen? Java Basics - Anfänger-Themen 31
J Bestimmte parameter aus Jsonfile auslesen Java Basics - Anfänger-Themen 15
HighLife Bestimmte Werte aus Array zählen Java Basics - Anfänger-Themen 15
T Bestimmte Zahlen ausgeben mit einer whilfe Schleife Java Basics - Anfänger-Themen 21
M Wie kann ich bei int-Variablen im exception handler auf bestimmte Strings reagieren? Java Basics - Anfänger-Themen 5
B Neue Liste erstellen, wenn Objekte bestimmte Referenz hat / Gruppierung von Einträgen Java Basics - Anfänger-Themen 12
B Nur eine bestimmte Anzahl an Arrays ausgeben Java Basics - Anfänger-Themen 9
M Regex für bestimmte Wörter bzw. bestimmte Zeichen erstellen Java Basics - Anfänger-Themen 5
B Von Array nur eine bestimmte Anzahl bekommen Java Basics - Anfänger-Themen 3
J Datei auslesen (nur bestimmte Stellen) Java Basics - Anfänger-Themen 2
L Nur Bestimmte Werte aus einem Array in ein anderes Speichern Java Basics - Anfänger-Themen 11
B Denkanstoß benötigt: Emails an bestimmte Emailadresse schicken Java Basics - Anfänger-Themen 6
U Mehrfacheingabe auf bestimmte Parameter prüfen Java Basics - Anfänger-Themen 8
L String auf bestimmte zeichen untersuchen Java Basics - Anfänger-Themen 9
L Bestimmte Werte eines Arrays ausgeben. Java Basics - Anfänger-Themen 3
P Input/Output Bestimmte Anzahl von Werten in einem Array an Methode übergeben Java Basics - Anfänger-Themen 2
Henri Bestimmte Werte eine XML-Datei ausgeben. Java Basics - Anfänger-Themen 8
M ComboBox bestimmte Elemente disablen/ausgrauen Java Basics - Anfänger-Themen 3
S JButton soll für bestimmte Zeit verschwinden Java Basics - Anfänger-Themen 5
E Datei einlesen und bestimmte Wörter ausgeben Java Basics - Anfänger-Themen 2
A Threads Threads bestimmte Aufgaben zuweisen... Java Basics - Anfänger-Themen 3
D Input/Output Buchstaben als bestimmte Zahl erkennen Java Basics - Anfänger-Themen 4
S Welche Datenstruktur ist die optimalste um Funktionen fuer bestimmte Wertebereiche abzurufen..? Java Basics - Anfänger-Themen 5
N Bestimmte Zeichen eines Strings umwandeln Java Basics - Anfänger-Themen 4
K Eine bestimmte Zeit, eine Schleife laufen lassen. Java Basics - Anfänger-Themen 4
A CSV datei eine Bestimmte Zeile ansprechen Java Basics - Anfänger-Themen 1
W char-Array auf bestimmte Zeichen prüfen Java Basics - Anfänger-Themen 10
C Array kopieren und nur bestimmte Werte speichern Java Basics - Anfänger-Themen 6
D Bestimmte Werte von Objekten aus einer ArrayList in eine andere ArrayList kopieren Java Basics - Anfänger-Themen 14
N Bestimmte Inhalte aus Datei lesen Java Basics - Anfänger-Themen 11
Ananaskirsche Input/Output Bestimmte Zeile aus Datei einlesen Java Basics - Anfänger-Themen 4
B Best Practice Bestimmte Zahl auslesen und in Variable speichern Java Basics - Anfänger-Themen 3
N Bestimmte Zeile aus einer Datei auslesen Java Basics - Anfänger-Themen 10
I Int Array, Zahl an bestimmte position setzten Java Basics - Anfänger-Themen 2
C [Bukkit Plugin] Blöcke eine bestimmte route entlang fliegen Java Basics - Anfänger-Themen 3
A Button in eine bestimmte Spalte platzieren Java Basics - Anfänger-Themen 4
D Bestimmte Zeile aus TXT Datei ausgeben Java Basics - Anfänger-Themen 4
A Eine Datei Lesen und bestimmte Position überschreiben Java Basics - Anfänger-Themen 2
M Bestimmte Zeichen auslesen Java Basics - Anfänger-Themen 2
G bestimmte dateiendungen in jtree rausfiltern Java Basics - Anfänger-Themen 7
W bestimmte Objekte in ArrayList auslesen Java Basics - Anfänger-Themen 8
J Bestimmte Anzahl Zeichen aneinander fügen Java Basics - Anfänger-Themen 9
C Bestimmte Informationen von Webseite suchen Java Basics - Anfänger-Themen 13
B Nur bestimmte Klasse ausführen Java Basics - Anfänger-Themen 6
Kenan89 Bestimmte Zeile in txt-Datei ersetzen Java Basics - Anfänger-Themen 4
D BufferedInputStream nur bestimmte Zeichen Java Basics - Anfänger-Themen 11
D Input/Output bestimmte Zeile auslesen Java Basics - Anfänger-Themen 3
B Bestimmte Ziffer Java Basics - Anfänger-Themen 27
B Input/Output In Datei an eine bestimmte Stelle schreiben Java Basics - Anfänger-Themen 37
S Bestimmte Objekte aus Collections anwählen/herausbekommen Java Basics - Anfänger-Themen 8
I Bestimmte Objekte einer Liste hinzufügen Java Basics - Anfänger-Themen 16
R Bestimmte Stellen eines BigInteger Java Basics - Anfänger-Themen 7
S Collections Aus Set<Object> bestimmte Typen entfernen Java Basics - Anfänger-Themen 3
S Bestimmte Methode von unbestimmter Datei Java Basics - Anfänger-Themen 6
V Bestimmte Stellen aus .txt Datei auslesen Java Basics - Anfänger-Themen 11
B bestimmte klammern im string ersetzten Java Basics - Anfänger-Themen 17
Binary.Coder JTable bzw. Tabelle in bestimmte Form überführen Java Basics - Anfänger-Themen 5
B Bestimmte Werte aus einem String entnehmen Java Basics - Anfänger-Themen 3
0 Grafik eine bestimmte Strecke laufen lassen Java Basics - Anfänger-Themen 6
X im Verzeichnissbaum recursiv nur bestimmte Dateien finden Java Basics - Anfänger-Themen 7
M Aus String bestimmte Inhalte auslesen Java Basics - Anfänger-Themen 8
M Reaktion auf bestimmte Zeit Java Basics - Anfänger-Themen 2
2 Bestimmte Anzahl von Bytes lesen und als string ausgeben? Java Basics - Anfänger-Themen 3
N Bestimmte Zeichen aus Strings zählen Java Basics - Anfänger-Themen 11
StrikeTom Bestimmte stelle in string herausfiltern Java Basics - Anfänger-Themen 7
M Float auf bestimmte Nachkommazahl runden Java Basics - Anfänger-Themen 3
E Bild eine bestimmte Anzahl blinken lassen Java Basics - Anfänger-Themen 3
B array bestimmte summe berechnen Java Basics - Anfänger-Themen 4
Luk10 Zufallszahl "ohne" eine bestimmte Zahl(en) Java Basics - Anfänger-Themen 8
S OOP Wie bei Spiel "17+4" eine Karte an bestimmte Position hinzufügen Java Basics - Anfänger-Themen 13
B OOP String auf bestimmte Zeichen abfragen Java Basics - Anfänger-Themen 4
S Bestimmte Elemente einer ArrayList löschen Java Basics - Anfänger-Themen 3
S Double bis bestimmte Nachkommzahl vergleichen (ohne zusätzliche Libs) Java Basics - Anfänger-Themen 12
N Text an bestimmte Stelle eines Dokuments schreiben Java Basics - Anfänger-Themen 6
G Bestimmte Zeile aus CSV ausgeben Java Basics - Anfänger-Themen 14
Assassin Nur bestimmte Daten aus txt auslesen... Java Basics - Anfänger-Themen 12
Developer_X Durch int Bestimmte Zeile überschreiben Java Basics - Anfänger-Themen 16
Developer_X Bestimmte Zeile aus TextDocument lesen Java Basics - Anfänger-Themen 2
V Nur bestimmte Werte zulassen Java Basics - Anfänger-Themen 2
M Bestimmte zeile aus .txt einlesen Java Basics - Anfänger-Themen 6
Q Nach Stringvorgabe bestimmte funktionen ausführen Java Basics - Anfänger-Themen 3
G Bestimmte Ebene eines Baumes rekursiv ausgeben Java Basics - Anfänger-Themen 49
I bestimmte Zahlen markieren.helppp. Java Basics - Anfänger-Themen 17
G Bestimmte Position im array auslesen Java Basics - Anfänger-Themen 8
H bestimmte objekte in ArrayList löschen? Java Basics - Anfänger-Themen 7
P Hilfe für JComboBox, bmp einbinden/bestimmte punkte auf bmp Java Basics - Anfänger-Themen 3
M bestimmte Zeichen in String eliminieren Java Basics - Anfänger-Themen 2
T Bestimmte Zeile aus einer .txt-Datei auslesen? Java Basics - Anfänger-Themen 10

Ähnliche Java Themen

Neue Themen


Oben