Frage zum Auslesen einer HTML-Zeile

Status
Nicht offen für weitere Antworten.

Nunz

Mitglied
Hiho liebe Java-Gemeinde,

ich bin auf folgendes Problem gestossen.
Auf einer bestimmten Seite ist ein Suchfeld, bei dem etwas eingibt und ein kleines DropDown-Fenster erscheint. Aus diesem DropDown-Fenster brauch ich bestimmte Zeilen bzw Werte.
Ich will aus einem HTML-Code bestimmte Gruppen per Pattern und Matcher auslesen, jedoch gibt mir die Konsole nichts aus sondern bleibt leer :?:

Code:
	while((sEntscheidung = bufferedReader.readLine() ) != null)
	{
//		System.out.println(sEntscheidung);
	
	        Pattern pattern = Pattern.compile("new Array\\(new Array\\(\"(.*?)\",\"Aktien\\\",\"(.*?)\\|");
		Matcher matcher = pattern.matcher(sEntscheidung);
		
		System.out.println(sEntscheidung);
		while (matcher.find())
		{
			System.out.println(sEntscheidungsAusgabe = matcher.group(1));
		}

Nun zu meiner Frage: Warum nimmt er mir die 2 Gruppen nicht und gibt sie korrekt aus?
Der restliche Code müsste stimmen, ich denke auch dass es nur an dieser Zeile liegt.


MfG,
Nunz


EDIT: Die erste Gruppe sollte der Name sein, der im DropDown erscheint und die Zweite ist das "URLAnhängsel", dass er nach einer bestimmten festen URL anhängen soll.
 
S

SlaterB

Gast
solange du hier keine Test-Zeile für sEntscheidung hinschreibst kann man dazu doch nix sagen..

es gibt 45459479 Zeilen, auf die das Pattern passt und 4934793^348598, auf die es nicht passt
 

Nunz

Mitglied
Code:
import java.net.*;
import java.util.regex.*;
import java.io.*;

public class VerarbeitungsEntscheidung
{
	String sEntscheidung = "";
	String sEingabeVariable = "";
	String sAusgabe;
	String sEntscheidungsAusgabe = "";
	
	String urlString = "http://www.boerse-frankfurt.de/Export/SuggestSearch.aspx?max_results=25&Keywords_mode=APPROX&Keywords=siemens&query=siemens&bias=100&lang=DE&target_id=0";
	
	public void VerarbeitungsEntscheidung() throws IOException
	{
		
	try
	{
	
	//Verbinden mit einer URL
	URL url = new URL(urlString);

	SocketAddress socketAdress = new InetSocketAddress( "inetgw1", 8080 );
	Proxy proxy = new Proxy( Proxy.Type.HTTP, socketAdress );
	
	//Öffnen eines Datenstroms zum Lesen der Daten
	InputStream iStream = url.openConnection(proxy).getInputStream();
	InputStreamReader iStreamReader = new InputStreamReader(iStream);
	
	//BufferedReader zum Auslesen der Zeile
	BufferedReader bufferedReader = new BufferedReader(iStreamReader);
	
	while((sEntscheidung = bufferedReader.readLine() ) != null)
	{

		Pattern pattern = Pattern.compile("new Array\\(new Array\\(\"(.*?)\",\"Aktien\\\",\"(.*?)\\|");
		Matcher matcher = pattern.matcher(sEntscheidung);
		
		System.out.println(sEntscheidung);
		while (matcher.find())
		{
			System.out.println(sEntscheidungsAusgabe = matcher.group(1));
		}
		
		
		
	}	
		
	
	}
	catch (MalformedURLException e)
	{
		System.out.println(e.getMessage());
	}
	catch (IOException e1)
	{
		System.out.println(e1.getMessage());
	}
	
	
	
}

}

So, sorry, mein Fehler ;)

Also dass ist meine Unterklasse zum Auslesen, welche Zahlenkombination hinten drangehängt werden soll.


Zuerst hatte ich das so, aber da ich ja nur einen Bruchteil davon brauch, hab ichs bis auf die Länge die man oben im Code sieht gekürzt.

String sHTMLCode = "(mmSuggestDeliver(0, new Array(\"Name\", \"Category\", \"Keywords\", \"Bias\", \"Extension\", \"IDs\", \"Lang\"), new Array(new Array()\"Siemens AG\", \"Aktien\", \"723610|DE0007236101|||\", \"95\", \"\", \"Siemens_AG|723610\", \"\"), new Array(\"Siemens AG ADRs\", \"Aktien\", \"632748|US8261975010|||\", \"90\", \"\", \"Siemens_AG_ADRs|632748\",\"\"), new Array(\"siemens/equity.western-europe\", \"Fonds\", \"575783|AT0000819792|||\", \"75\", \"\", \"siemens/equity.western-europe|575783\", \"\"), new Array(\"SIEMENS FINANC. 01/11\", \"Anleihen\", \"687191|XS0131224155|Siemens Financieringsmaatschappij N.V.\", \"90\", \"\", \"687191|Siemens Financieringsmaatschappij N.V.|Unternehmensanleihe|Siemens Financieringsmaatschappij N.V.\", \"\"), new Array(\"SIEMENS FINANC. 08/14 MTN\", \"Anleihen\", \"A0TWJ1|XS0369462022|Siemens Financieringsmaatschappij N.V.\", \"90\", \"\", \"A0TWJ1|Siemens Financieringsmaatschappij N.V.|Unternehmensanleihe|Siemens Financieringsmaatschappij N.V.\", \"\"), new Array(\"SIEMENS FINANC. 08/18 MTN\", \"Anleihen\", \"A0TWJ2|XS0369461644|Siemens Financieringsmaatschappij N.V.\", \"90\", \"\", \"A0TWJ2|Siemens Financieringsmaatschappij N.V.|Sonstige|Siemens Financieringsmaatschappij N.V.\", \"\"), new Array(\"SIEMENS FINANC. 09/10 FLR\", \"Anleihen\", \"A0TV1B|XS0366542362|Siemens Financieringsmaatschappij N.V.\", \"90\", \"\", \"A0TV1B|Siemens Financieringsmaatschappij N.V.|Sonstige|Siemens Financieringsmaatschappij N.V.\", \"\"), new Array(\"SIEMENS FINANC. 10/11 FLR\", \"Anleihen\", \"A0TV1C|XS0366542446|Siemens Financieringsmaatschappij N.V.\", \"90\", \"\", \"A0TV1C|Siemens Financieringsmaatschappij N.V.|Sonstige|Siemens Financieringsmaatschappij N.V.\", \"\"), new Array(\"WAVE auf Siemens\", \"Zertifikate\", \"723610|DE0007236101|DB23Q1|DE000DB23Q17\", \"80\", \"OPEN END\", \"DB23Q1|38|723610|DE0007236101|Deutsche Bank|Knock-Out & Open-End Knock-Out\", \"\"), new Array(\"WAVE auf Siemens\", \"Zertifikate\", \"723610|DE0007236101|DB26UN|DE000DB26UN3\", \"80\", \"14.01.2009\", \"DB26UN|38|723610|DE0007236101|Deutsche Bank|Knock-Out & Open-End Knock-Out\", \"\"), new Array(\"WAVE auf Siemens\", \"Zertifikate\", \"723610|DE0007236101|DB0M31|DE000DB0M315\", \"80\", \"OPEN END\", \"DB0M31|38|723610|DE0007236101|Deutsche Bank|Knock-Out & Open-End Knock-Out\", \"\"), new Array(\"WAVE auf Siemens\", \"Zertifikate\", \"723610|DE0007236101|DB17WP|DE000DB17WP3\", \"80\", \"11.02.2009\", \"DB17WP|38|723610|DE0007236101|Deutsche Bank|Knock-Out & Open-End Knock-Out\", \"\"), new Array(\"WAVE auf Siemens\", \"Zertifikate\", \"723610|DE0007236101|DB26UP|DE000DB26UP8\", \"80\", \"14.01.2009\", \"DB26UP|38|723610|DE0007236101|Deutsche Bank|Knock-Out & Open-End Knock-Out\", \"\")), 13, 0)";


Diese einzig diese rot markierten Daten brauch ich.
 
S

SlaterB

Gast
so, auf sinnvolle Maße gekürzt:
Code:
public class Test
{


    public static void main(String[] args)
        throws Exception
    {

        String sEntscheidung = "yy new Array(new Array()\"Siemens AG\", \"Aktien\", \"723610|";
        Pattern pattern = Pattern.compile("new Array\\(new Array\\(\"(.*?)\",\"Aktien\\\",\"(.*?)\\|");
        Matcher matcher = pattern.matcher(sEntscheidung);

        System.out.println(sEntscheidung);
        while (matcher.find())
        {
            System.out.println(matcher.group(1));
        }

    }
}
nun kann man anfangen nachzudenken, erstmal nur einen Match/ ein find() herstellen:

ich sehe z.B., dass du mal im Pattern \\\" stehen hast und an anderer Steller nur \", was darfs denn sein?

hängt natürlich davon ab, ob der gepostete String der tatsächliche Text ist oder der Java-String,
also tatsächlicher Text =
> new Array(new Array()\"Siemens AG\", \"Aktien\", \"723610|
oder
> new Array(new Array()"Siemens AG", "Aktien", "723610|
?

jedenfalls enthät der String entweder nur " oder nur \", eine Mischung in deinem Pattern macht wenig Sinn,

dann hast du im Pattern nach dem zweiten new Array ein \\(, aber keine schließende Klammer?
usw. sowas musst du alles testen,

und am besten noch kleiner anfangen als in meinem Code,
erstmal ein Pattern
> new Array
dann
> new Array\\(
usw, Schritt für Schritt ans Ziel


ein langes Pattern fertig schreiben und geht nicht - das klappt ja nicht
 

Nunz

Mitglied
Ich hab jetzt nochmal die Zeile auslesen lassen die ich brauch auf verkürzte Weise:

mmSuggestDeliver(0, new Array("Name", "Category", "Keywords", "Bias", "Extension", "IDs", "Lang"),
new Array(new Array("Siemens AG", "Aktien", "723610|DE0007236101|||", "95", "", "Siemens_AG|723610", ""),
new Array("Siemens AG ADRs", "Aktien", "632748|US8261975010|||", "90", "", "Siemens_AG_ADRs|632748", "")
Zu der Aussage, dass es manchmal 3 Backslashs sind und manchmal nur Einer: Da ich ja diese massige Anzahl an Anführungsstrichen in der HTML-Zeile (s.o) habe, muss ich das ja irgendwie beheben indem ich nen Backslash vor jedes Anfühungszeichen setze, da er mir in Eclipse sonst meckert.

Nun hab ichs wieder auseinandergepfriemelt und es sieht momentan so aus (HTML-Code-Schnipsel):

Code:
Pattern pattern = Pattern.compile("new Array(new Array(\"(.*?)\", \"Aktien\", \"723610|(.?*)|||\"");

Dadurch, dass ich jetzt aber durch die Pipes am Ende des Arrays habe flieg ich jedes mal mit ner PatternSyntaxException raus, weil ich höchstwarscheinlich keine \ vor den Pipes am Ende habe.

Exception in thread "main" java.util.regex.PatternSyntaxException: Unclosed group near index 56
new Array(new Array("(.*?)", "Aktien", "723610|(.*?)|||"

Durch Eclipse wird mir angezeigt, dass hinter dem letzten Anführungsstrich nen Fehler sein soll.

Könnte eventuell an der Fehlenden Klammer am Ende des Strings liegen, jedoch beinhaltet erste "new Array" die kompletten Auswahlmöglichkeiten des DropDown-Windows.
Ergo, ist das ja eigentlich egal ob da hinten eine Klammer fehlt oder nicht, da es ja in nem String is, oder irre ich mich da?
 
S

SlaterB

Gast
als ~zehntes Zeichen hast du ein nicht escaptes (, aber kein )

> Da ich ja diese massige Anzahl an Anführungsstrichen in der HTML-Zeile (s.o) habe, muss ich das ja irgendwie beheben indem ich nen Backslash vor jedes Anfühungszeichen setze

gerne gerne, ich weiß ja nicht wie dein String aussieht, bastel dir alles so zurecht wie es sein muss,
mein Hinweis, dass du dann aber für ALLE Anführungszeichen \\\" ins Pattern schreiben musst (oder gar kein \\\", je nachdem), ist dennoch hilfreich
 

Nunz

Mitglied
Ok die Exception wurde behoben, da ich vor die öffnenden Klammern im String nen Backslash setzen musste um es sozusagen auszukommentieren, jedoch bringt er mir wieder die ganze Zeile und ich raffs einfach nicht wieso oO
 
G

Guest

Gast
Code:
	public static void testSuche() {
		
		String line = "mmSuggestDeliver(0, new Array(\"Name\", \"Category\", \"Keywords\", \"Bias\", \"Extension\", \"IDs\", \"Lang\"),new Array(new Array(\"Siemens AG\", \"Aktien\", \"723610|DE0007236101|||\", \"95\", \"\", \"Siemens_AG|723610\", \"\"), new Array(\"Siemens AG ADRs\", \"Aktien\", \"632748|US8261975010|||\", \"90\", \"\", \"Siemens_AG_ADRs|632748\", \"\")";
		
		Pattern pattern = Pattern.compile("\\),\\s*(new Array\\()?\\s*new Array\\(\"(.*?)\",\\s*\"Aktien\",\\s*\"\\d+\\|(.*?)\\|");
		Matcher matcher = pattern.matcher(line);
		while (matcher.find()) {
			String group1 = matcher.group(2);
			String group2 = matcher.group(3);
			System.out.println(group1 + " - "+ group2);

		}
		// Siemens AG - DE0007236101
		// Siemens AG ADRs - US8261975010
	}
 

Nunz

Mitglied
Mh warst schneller ;)

Wenn ich das nun aber wieder so mache wie du meintest fliegen mir wieder die Exceptions um den Kopf :shock: und ich raffs voll nicht was du meinst mit den \\\" ;), als Tipp bestimmt hilfreich, nur komm ich auf keinen grünen Zweig irgendwie :autsch:
 
S

SlaterB

Gast
musst ja auch nicht raffen, solange es in der Hinsicht noch kein Problem gibt,

-----

wenn du bisher ansonsten noch eine Frage hast dann spiele ich mir deinem Mega-Pattern nicht weiter mit
SlaterB hat gesagt.:
und am besten noch kleiner anfangen als in meinem Code,
erstmal ein Pattern
> new Array
dann
> new Array\\(
usw, Schritt für Schritt ans Ziel


ein langes Pattern fertig schreiben und geht nicht - das klappt ja nicht
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
Zrebna Frage zu Test-Driven Development (TDD) Java Basics - Anfänger-Themen 3
I Frage Thymeleaf -> Fehler ignorieren und mit "" ersetzen? Java Basics - Anfänger-Themen 15
I Frage Thymeleaf -> Prefix / Suffix ändern? Java Basics - Anfänger-Themen 11
D Rekursions Probleme / frage Java Basics - Anfänger-Themen 4
T Frage zu Parse Java Basics - Anfänger-Themen 2
H Frage an die Profis Java Basics - Anfänger-Themen 4
J Eine konzeptionelle Frage zu OOP Java Basics - Anfänger-Themen 3
P Frage zu Rekursion und Backtracking Java Basics - Anfänger-Themen 2
H Frage zur Ausgabe Java Basics - Anfänger-Themen 4
H Frage zu arithmetischen Operationen Java Basics - Anfänger-Themen 20
F Kurze Frage zu replace() Java Basics - Anfänger-Themen 19
JavaSchmecktLecker Polymorphie Frage zur Methodenüberschreibung Java Basics - Anfänger-Themen 21
J Frage zu einem "Taschenrechner" code Java Basics - Anfänger-Themen 9
B Erste Schritte Frage zu Instanzierung und Referenzen Java Basics - Anfänger-Themen 8
DoubleM Runtime.getRuntime().exec Frage Java Basics - Anfänger-Themen 2
J Eine theoretische Frage zur Praxis - JPanel oder Canvas Java Basics - Anfänger-Themen 5
O Frage: Formaler Typbezeichner? Java Basics - Anfänger-Themen 3
I BlueJ Queue Frage für Klausur Java Basics - Anfänger-Themen 2
N Verständnis Frage zu Variablen Java Basics - Anfänger-Themen 3
N Spezielle frage zum Comparator Java Basics - Anfänger-Themen 6
L Frage zum Array Java Basics - Anfänger-Themen 1
A Frage zum UML Design Java Basics - Anfänger-Themen 1
I Hilfe bei Klausur Frage Java Basics - Anfänger-Themen 8
izoards Drucken Frage zu FAQ Beitrag Java Basics - Anfänger-Themen 2
J Frage zu meinem Code (OOP) Java Basics - Anfänger-Themen 4
sserio Split() -> Regex Frage. Java Basics - Anfänger-Themen 7
A OCA Study Guide: 2. Frage aus Kapitel 3 Java Basics - Anfänger-Themen 9
sserio Date Library Frage Java Basics - Anfänger-Themen 9
Max246Sch Frage zu Währungsrechner Code Java Basics - Anfänger-Themen 2
sserio Frage zu HashMaps Java Basics - Anfänger-Themen 20
sserio Frage zu Threading - Multithreading Java Basics - Anfänger-Themen 2
sserio Frage zu Lambda Ausdrücken Java Basics - Anfänger-Themen 7
sserio Frage zu BigInteger Java Basics - Anfänger-Themen 1
D Frage bzgl. Enum-Handhabung Java Basics - Anfänger-Themen 16
xxx12 Frage Java Basics - Anfänger-Themen 2
I Generelle Frage zu Mikroservices (Spring Boot?), Docker... Java Basics - Anfänger-Themen 7
R Frage zu Methoden (Rückgabewert u. ohne.) Java Basics - Anfänger-Themen 2
A Frage zur programmierung Java Basics - Anfänger-Themen 12
M Frage zur Methode split der Klasse String Java Basics - Anfänger-Themen 32
R Input/Output Frage zu Java IO Java Basics - Anfänger-Themen 6
M Frage zu printWriter Java Basics - Anfänger-Themen 5
C Frage zu OLSMultipleLinearRegression Java Basics - Anfänger-Themen 31
KogoroMori21 Frage zum Euklidischen Algorithmus Java Basics - Anfänger-Themen 11
S Verständnis-Frage zu einer HÜ? Java Basics - Anfänger-Themen 1
F Frage betreff Programm mit dem man C++-Code in JAVA-Code übersetzen lassen kann Java Basics - Anfänger-Themen 2
L Frage zur Ticket Maschine Java Basics - Anfänger-Themen 1
J Frage zu OOP-Klassendiagramm Java Basics - Anfänger-Themen 8
OSchriever Frage zu Compiler Java Basics - Anfänger-Themen 8
H Frage zu Throw Exception Java Basics - Anfänger-Themen 2
TimoN11 Frage zu Java-Vererbung (Cast) Java Basics - Anfänger-Themen 5
Bademeister007 Hallo Leute ich hab eine Frage zur ArrayList Java Basics - Anfänger-Themen 8
F Frage betreff Programmierbücher zu Lagerverwaltung als Konsolenprogramm Java Basics - Anfänger-Themen 3
dieter000 Kurze Frage kann mir ejmand kurz diesen Code erklären, bzw wie man die zeilen erklärt und so Java Basics - Anfänger-Themen 1
I String.split regex Frage Java Basics - Anfänger-Themen 2
N Best Practice Frage zum MVC-Pattern Java Basics - Anfänger-Themen 2
dieter000 Frage zu einem Beispiel... Java Basics - Anfänger-Themen 5
J Frage zum Loggen Java Basics - Anfänger-Themen 18
J Methoden Frage: Array-Werte in anderer Methode ändern Java Basics - Anfänger-Themen 4
Zrebna Frage zum "Referenzen-konzept" in Java Java Basics - Anfänger-Themen 8
JD_1998 Array-Position aus einer Methode in einer anderen ausgeben (Kurze Frage) Java Basics - Anfänger-Themen 2
marcooooo Frage zu bestimmten Beispiel Java Basics - Anfänger-Themen 31
NeoLexx equals()-Methode Verständnis Frage anhand Code Beispiel Java Basics - Anfänger-Themen 22
N Input/Output Eine Frage über system.out.println. Java Basics - Anfänger-Themen 10
B Erste Schritte Learning Coding (!) Frage an erfahrene Programmierer. Java Basics - Anfänger-Themen 23
M konzeptuelle Frage: In welcher Klasse definiert man am Besten Methoden, die die Kommunikation mit dem User regeln? Java Basics - Anfänger-Themen 8
B Frage zum Code verständnis im Resultat Java Basics - Anfänger-Themen 10
C Exception-Frage Java Basics - Anfänger-Themen 3
J Eine Frage zur Schreibweise == ? : Java Basics - Anfänger-Themen 3
S Frage des Designs Java Basics - Anfänger-Themen 1
JavaTalksToMe Extends/Implements Frage Java Basics - Anfänger-Themen 3
pkm Frage zu Servletfunktion Java Basics - Anfänger-Themen 0
B Frage zur Währungsumrechnung Java Basics - Anfänger-Themen 3
S Allgemeine Frage über Generics und Vererbungen Java Basics - Anfänger-Themen 5
Kirby.exe Frage zur Verwendung von Interfaces Java Basics - Anfänger-Themen 6
D Frage zu Strings einer Exception Java Basics - Anfänger-Themen 4
L Wie frage ich ab, ob in einem Array, Werte doppelt vorkommen? Java Basics - Anfänger-Themen 4
D Frage zur IDE IntelliJ IDEA Java Basics - Anfänger-Themen 6
H Frage zum 2d Array Java Basics - Anfänger-Themen 1
N Frage zum Newton-Fraktal Java Basics - Anfänger-Themen 1
H Frage zu interfaces Java Basics - Anfänger-Themen 1
J Frage dazu Variablen klassenübergreifend zu verändern Java Basics - Anfänger-Themen 22
I Frage zu SkipList Java Basics - Anfänger-Themen 4
G Frage zu JScrollPane Java Basics - Anfänger-Themen 12
Kirby.exe Allgemeine Frage Java Basics - Anfänger-Themen 3
W Frage zu anonymen Klassen Java Basics - Anfänger-Themen 4
J Kleine Frage zu OOP Java Basics - Anfänger-Themen 371
S Frage Klasse und Objekte Java Basics - Anfänger-Themen 2
F Frage zu Iteratoren Java Basics - Anfänger-Themen 2
C Erste Schritte Frage zur ArrayList Java Basics - Anfänger-Themen 15
J Frage zur Vererbung Java Basics - Anfänger-Themen 1
H Frage zur ermittlung eines doppelte Paars aus Sotieralgorithmus Java Basics - Anfänger-Themen 4
H Frage zum Array Java Basics - Anfänger-Themen 17
G Schach -Frage 2- Maussteuerung Java Basics - Anfänger-Themen 7
G Schach in Java - Allgemeine Frage zur Architektur Java Basics - Anfänger-Themen 7
B Fachliche Frage bei Rechnungen Java Basics - Anfänger-Themen 16
B Frage zu: String... strings -> Ungleiche Anzahl an Parameter? Java Basics - Anfänger-Themen 4
B Frage zu Datenbank Design - Rechnungen, Angebote... und deren Positionen Java Basics - Anfänger-Themen 4
H Frage zu Parameter einer Methode Java Basics - Anfänger-Themen 2
H Einfache Frage zur Punktnotation objektname.methode(wert) Java Basics - Anfänger-Themen 2
H Frage zu Parameter einer Methode Java Basics - Anfänger-Themen 3

Ähnliche Java Themen

Neue Themen


Oben