Scanner - Zeile parsen

Status
Nicht offen für weitere Antworten.

Johnny00

Mitglied
Hallo liebes Forum,

ich lese mittels meinem kleinen programm einen ganzen quellcode aus.
nun möchte ich gerne jede zeile einzeln parsen und alle img tags rausfischen.
die img tags haben die syntax <img src=“.... .gif“ height=“..“, width=“..“>.
Wie kann ich da gezielt die Datennamen rausfischen?

Wie kann ich denn mittels der Scanner Klasse das realisieren?
ich weiß ich kann über die scanner klasse einen delimiter definieren aber ich weiß nicht genau wie der aussehen soll..

Wäre cool wenn ihr mir auf die sprünge helfen könntet.


liebe grüße
johnny
 

Ark

Top Contributor
Zum Beschreiben eines öffnenden HTML-Tags sollten reguläre Ausdrücke genügen. In deinem Fall etwa:
Code:
<img src="(.*?)\.gif" height="(.*?)" width="(.*?)">
Die einzelnen Teile lassen sich dann mit group(int x) extrahieren, wobei x eben 1, 2 oder 3 ist, je nachdem. Mehr dazu in java.util.regex.Pattern.

Ark
 

Johnny00

Mitglied
Danke Ark für deine Antwort!

Ich hab das nun so gemacht:

Java:
            Scanner s = new Scanner(new BufferedReader(new FileReader(dateiname)));
            s.useDelimiter ("<img src=\"(.*?)\\.gif\" height=\"(.*?)\" width=\"(.*?)\">");
            
            while (s.hasNext()) {
               System.out.println(s.next());
            }

leider spuckt der mir die ganze quelltext datei komplett aus von oben bis unten.
hast du ne ahnung wodran das liegen könnte? ich möchte wie gesagt die img tags analysieren und daraus den dateinamen extrahieren.. wäre nett wenn du mir erneut helfen könntest

*Edit
Kann es sein dass ich die Scanner Klasse falsch verstanden habe?
Sie splittet den Text in Zeilen und dann muss ich in seperat die Zeilen mittels einen regulären ausdruck prüfen?
 

Johnny00

Mitglied
Ich habe das nun so:

Java:
            try{
            Scanner s = new Scanner(new File ("Quelltext.html"));
            s.useDelimiter (System.getProperty("line.separator")); 

            String pattern = "<img src=\"(.*?)\\.gif\" height=\"(.*?)\" width=\"(.*?)\">"; 
            String tokens[] = null;
            
            while (s.hasNext()) {
               tokens = pattern.split(s.next());
               for (int i = 0; i < tokens.length; i++)
                    System.out.println(tokens[i]);
            }
            
            s.close();
        } catch (Exception e) { System.out.println (e); }

Aber ich bekomme eine Sehr komische ausgabe:

Java:
<img src="(.*?)\.gif" height="(.*?)" width="(.*?)">
<img src="(.*?)\.gif" height="(.*?)" width="(.*?)">
<img src="(.*?)\.gif" height="(.*?)" width="(.*?)">
<img src="(.*?)\.gif" height="(.*?)" width="(.*?)">

<
i
m
g
 
s
r
c
=
"
(
.
*
?
)
\
.
g
i
f
"
.....
<img src="(.*?)\.gif" height="(.*?)" width="(.*?)">
java.util.regex.PatternSyntaxException: Unclosed character class near index 14
/* <![CDATA[ */

Wieso ? :/

*OKAY ich hab den Fehler gesehen:

Java:
 Pattern pattern = Pattern.compile ("<img src=\"(.*?)\\.gif\" height=\"(.*?)\" width=\"(.*?)\">");

muss dahin.


Ich bekomm leider als Ausgabe wieder die gleiche datei.. was ich nciht verstehen kann :(
 
Zuletzt bearbeitet:

Ark

Top Contributor
Ungetestet, wie immer:
Java:
Pattern p=Pattern.compile("<img src=\"(.*?)\\.gif\" height=\"(.*?)\" width=\"(.*?)\">");
Matcher m=p.matcher(hierKompletteDateiAlsString);
while(m.find()){
    System.out.println(m.group(1)+"\t"+m.group(2)+"\t"+m.group(3));
}
Ark
 

Johnny00

Mitglied
Ich habe noch eine klitze kleine Frage. Ich benutze den Ausdruck:

Java:
Pattern pattern = Pattern.compile ("<img src=\"(.*?)\\.gif\" (.*?)>");

Wenn ich den Dateinamen extrahiere mit match.group(1) dann ohne die Dateiendung.
Wie kann ich den Ausdruck so umändern, dass automatisch die DateiEndung beigefügt wird?

Sonst muss ich angeben: match.group (1) + ".gif"...
 

Localtime

Mitglied
Hi,

schließe .gif in die erste Gruppe mit ein (runde Klammer versetzen):

Java:
Pattern p = Pattern.compile("<img src=\"(.*?\\.gif)\" (.*?)>");


alternativ kannst Du so auch alles aus dem src-Attribut separieren (egal ob .gif, .jpg ...):

Java:
Pattern p = Pattern.compile("<img src=\"(.*?)\" (.*?)>");


Gruß

Localhost
 
Zuletzt bearbeitet:
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
onlyxlia Anzahl Random Zahlen mit Scanner abfragen und in Array speichern Java Basics - Anfänger-Themen 10
M Scanner Input mit if überprüfen Java Basics - Anfänger-Themen 5
D Scanner Java Basics - Anfänger-Themen 2
T scanner nicht erkannt Java Basics - Anfänger-Themen 3
T scanner eingaben erkennen und umtauschen Java Basics - Anfänger-Themen 4
Ostkreuz Int Scanner auf Enter Eingabe prüfen Java Basics - Anfänger-Themen 4
H Scanner nextLine() bringt Dateipfad Java Basics - Anfänger-Themen 1
Jul1n4tor Scanner error bei Eingabe die kein Integer ist Java Basics - Anfänger-Themen 4
Jul1n4tor Programm mit Scanner und If-Statements Java Basics - Anfänger-Themen 2
I Scanner Loop Java Basics - Anfänger-Themen 1
J Scanner cannot be resolved to a type Java Basics - Anfänger-Themen 3
C Scanner und If-Anweisung in Kombi Java Basics - Anfänger-Themen 3
X Erste Schritte Scanner eingabe wird übersprungen Java Basics - Anfänger-Themen 4
T j.u.Scanner(Sys.in).nextLine() wieder schließen? Java Basics - Anfänger-Themen 5
J Erste Schritte Scanner Java Basics - Anfänger-Themen 4
P Mit dem Scanner Klassen aufrufen Java Basics - Anfänger-Themen 3
javapingu Endlosschleife bei User Input mit try Scanner Java Basics - Anfänger-Themen 7
C Problem mit mehreren Methoden + Scanner Java Basics - Anfänger-Themen 5
Poppigescorn Arrayliste Mittels Scanner erweitern Java Basics - Anfänger-Themen 6
Jan_x8 Timer/Scanner Java Basics - Anfänger-Themen 5
M Scanner Klasse Java Basics - Anfänger-Themen 4
W Objekte über Scanner Input; ToString Probleme... Java Basics - Anfänger-Themen 4
F Erste Schritte java.util.Scanner: Beliebig langen Text per Paste in Console eingeben ? Java Basics - Anfänger-Themen 14
H Quellcode Scanner Klasse Java Basics - Anfänger-Themen 2
N java.util.InputMismatchException Fehler Java Scanner Java Basics - Anfänger-Themen 5
S Scanner soll Groß-/ Kleinschreibung ignorieren Java Basics - Anfänger-Themen 2
Y Wie kann ich Konsoleneingaben durch den Scanner mit JUnit 4 testen? Java Basics - Anfänger-Themen 1
J Scanner-Klasse Java Basics - Anfänger-Themen 2
B Scanner-If/else kleine Abhebungs-Simulation Java Basics - Anfänger-Themen 3
A Scanner Befehl Java Anfänger Java Basics - Anfänger-Themen 8
D Scanner- Exception NoSuchElementException Java Basics - Anfänger-Themen 2
G Scanner nutzen und Index auslesen Java Basics - Anfänger-Themen 8
N Problem mit Scanner Java Basics - Anfänger-Themen 2
V Ersätze für Java-Scanner Java Basics - Anfänger-Themen 9
P Methode die eigentlich einen Scanner benötigt mit toString() Java Basics - Anfänger-Themen 5
A Scanner-Error Java Basics - Anfänger-Themen 8
D Java Scanner Java Basics - Anfänger-Themen 9
M String in Scanner einlesen Java Basics - Anfänger-Themen 6
N Eingabe Kommazahlen über Scanner Java Basics - Anfänger-Themen 2
ZH1896ZH Verstehe verschieden Scanner und hasNext() nicht ganz Java Basics - Anfänger-Themen 2
O Mehrfache Scanner-Eingabe durch Komma getrennt Java Basics - Anfänger-Themen 6
I Scanner auf 10 Stellen begrenzt? Java Basics - Anfänger-Themen 5
B Barcode Scanner Java Basics - Anfänger-Themen 3
V Wie lasse ich die for-Schleife so oft laufen wie per Scanner angegeben? Java Basics - Anfänger-Themen 3
L Scanner schließen in While-Schleife? Java Basics - Anfänger-Themen 2
S Scanner Java Basics - Anfänger-Themen 36
S Frage zu Scanner Java Basics - Anfänger-Themen 3
cpt.Tomato Scanner problem mit Passwort Login Java Basics - Anfänger-Themen 3
O Scanner Klasse Java Basics - Anfänger-Themen 8
M java.util.scanner Fehler Java Basics - Anfänger-Themen 5
B mehrere Werte mit scanner und while schleife einlesen, max berechnen bzw addieren Java Basics - Anfänger-Themen 2
W Eclipse Che Scanner Java Basics - Anfänger-Themen 8
H Vererbung Static Scanner Objekt verwenden - von StdIn in einer importierten Klasse lesen Java Basics - Anfänger-Themen 10
X Erste Schritte Problem mit scanner Java Basics - Anfänger-Themen 2
A Scanner.useLocale(Locale.US); Java Basics - Anfänger-Themen 4
M Datei einlesen mit Scanner funktioniert nicht (FileNotFoundException) Java Basics - Anfänger-Themen 6
I Scanner und Arrays Java Basics - Anfänger-Themen 2
M Scanner-Eingabe nach gewissem Zeitraum überprüfen Java Basics - Anfänger-Themen 2
Neoline Methoden Scanner Methode Java Basics - Anfänger-Themen 9
E Probleme mit Scanner Java Basics - Anfänger-Themen 4
A Java Scanner Funktioniert nicht Java Basics - Anfänger-Themen 2
B Vom scanner in ein Arraylist Java Basics - Anfänger-Themen 7
L Scanner Ausgabe Java Basics - Anfänger-Themen 37
S Zeilenumbruch mit Scanner erkennen Java Basics - Anfänger-Themen 9
O Erste Schritte Scanner mehrere male benutzen (Konsole) Java Basics - Anfänger-Themen 7
W Wie arbeite ich mit dem Typ Scanner? Java Basics - Anfänger-Themen 5
J Input/Output Scanner Input als etwas einsetzen Java Basics - Anfänger-Themen 3
R CMDTools Scanner Fehler Java Basics - Anfänger-Themen 10
D nextInt() nicht für Scanner definiert? Java Basics - Anfänger-Themen 2
N Operatoren Suchen nach einer bestimmten Eingabe (durch Scanner) Java Basics - Anfänger-Themen 7
F Scanner Problem Java Basics - Anfänger-Themen 8
T Variablen Array mit Scanner befüllen Java Basics - Anfänger-Themen 6
C Java Scanner einlesen von txt Dokument InputMismatch Java Basics - Anfänger-Themen 9
b1ck Scanner schließen, erneute Verwendung Java Basics - Anfänger-Themen 12
F Scanner - nextLine() gibt leeren String zurück Java Basics - Anfänger-Themen 2
T Problem mit Scanner. Java Basics - Anfänger-Themen 4
J Methode über Scanner aufrufen Java Basics - Anfänger-Themen 15
J Erste Schritte Scanner negative zahl einlesen und verwenden. Java Basics - Anfänger-Themen 6
W Methoden Probleme mit der Scanner Methode Java Basics - Anfänger-Themen 2
Silvascus Scanner Problem Java Basics - Anfänger-Themen 5
W Erste Schritte import java.util.scanner funktioniert nicht Java Basics - Anfänger-Themen 2
TheMenox Error bei Scanner - woher? Java Basics - Anfänger-Themen 14
D Fehler bei String eingabe via Scanner Java Basics - Anfänger-Themen 6
F Problem do while Schleife und Scanner Java Basics - Anfänger-Themen 2
O POI Apache sheet scanner Java Basics - Anfänger-Themen 1
A regulären Ausdruck mit Hilfe der Klasse Scanner in einem String finden Java Basics - Anfänger-Themen 2
F Array mit Scanner-Werten Java Basics - Anfänger-Themen 4
M Input/Output Scanner schließt nicht Java Basics - Anfänger-Themen 2
M Scanner class Java Basics - Anfänger-Themen 6
K Mit Scanner aus einer txt Datei lesen und jede Person mit name, vorname, geburtsdatum speichern Java Basics - Anfänger-Themen 5
S Array mit "foreach"-Schleife und nextInt (aus Scanner) beschreiben Java Basics - Anfänger-Themen 6
G Strings mit Scanner (nextLine) einlesen Java Basics - Anfänger-Themen 7
Q Scanner auf eine Zahl beschränken Java Basics - Anfänger-Themen 2
S Sonderzeichen '|' (u007C) mit Scanner einlesen Java Basics - Anfänger-Themen 1
T Scanner lässt sich nicht importieren Java Basics - Anfänger-Themen 1
R scanner in String funktioniert nicht Java Basics - Anfänger-Themen 1
P scanner ein Double einlesen Java Basics - Anfänger-Themen 10
A InputMismatchException mit Scanner Java Basics - Anfänger-Themen 6
J scanner, String einlesen und vergleichen Java Basics - Anfänger-Themen 3
B Input/Output Scanner-Probleme bei String-Lesen Java Basics - Anfänger-Themen 3

Ähnliche Java Themen

Neue Themen


Oben