String ordentlich trennen (regex, split())?

Status
Nicht offen für weitere Antworten.

BoZA

Mitglied
Servus,

ich bin gerade etwas am Verzweifeln!!

Mein Problem stellt sich wie folgt dar. Ich versuche eine Textdatei einzulesen und packe sie komplett in einen String.
Dann benötige ich einzelne Information aus dem String für einen Rätselkatalog. Vorweg: Es ist eine Aufgabe für die Uni.

Mein Ansatz war, den String mit Hilfe von regulären Ausdrücken zu trennen.
Doch da stoß ich einfach an meine Grenzen, da meine Kenntnisse zu diesem Thema doch sehr begrenzt sind.
Ich habe hier mir angeschaut, aber auch das konnte mir nicht wirklich weiter helfen.

Evtl. mal ein Auszug aus der txt.

Wie nennen die Schweizer ein sehr beliebtes sichelfˆrmiges Vanille-Gebäck?
a) Kipferl :b) Vanille-Hˆrnli :c) Gipfeli
richtigeAntwort: c

Einen Brief ans Christking schicken? Wo gibt es ein richtiges Weihnachtspostamt?
a) Himmelpforten :b) Christhausen :c) Winterberg
richtigeAntwort: a

S¸fle Nikol‰use heben den Schokoladenkonsum der Deutschen erheblich. Dieser liegt pro Kopf bei
a) 3 kg :b) 7 kg :c) 10 kg im Jahr
richtigeAntwort: c

Das Problem ist für mich auch die Unregelmäßigkeit des Fragezeichens!
Ich wollte aus einer Frage fünf Information entnehmen.
1. Die Frage selbst.
2. Antwort Möglichkeit A.
3. Antwort Möglichkeit B.
4. Antwort Möglichkeit C.
5. Die richtige Antwort.

Den Anstoß habe ich versucht mit:
Code:
private void raetselFragenSplitten()
	{
		if (textDatei != "")
		{
			test = null;
			test = textDatei.split("[?:]");
			for (int loop = 0; loop < test.length; loop++)
			{
				System.out.println(test[loop]);
			}
		}

Dadurch trennt er mir das ganze nach jedem "?" und nach jedem ":".
Aber das bringt mich nicht wirklich zum Ziel.

Ist regex überhaupt das Richtige dafür? (bzw. die split() Methode)??

Vielen Dank für eure hilfe im Voraus!
Anbei die txt Dateien. Textdateien
 
S

SlaterB

Gast
denkbar wäre, nach Zeilenumbrüchen zu trennen,
leere Zeilen ignorierst du bzw. dienen zur Trennung von Fragen,
Zeilen mit "a)" am Anfang enthalten die drei Lösungen,
die Zeile danach die richtige Antwort, alles davor ist die Frage
 

BoZA

Mitglied
Danke erstmal für den Tipp.

Ich Splitte jetzt nach jedem "a)"

Code:
private void raetselFragenSplitten()
	{
		if (textDatei != "")
		{
			test = null;
			test = textDatei.split(".*a\\)");
			for (int loop = 0; loop < test.length; loop++)
			{
				System.out.println(test[loop] + "-(gesplittet)");
			}
		}
	}

Und bekomme dann das ungefähr so hin mit der Ausgabe:
Wie nennen die Schweizer ein sehr beliebtes sichelförmiges Vanille-Gebäck?
-(gesplittet)
Kipferl :b) Vanille-Hörnli :c) Gipfeli
richtigeAntwort: c

Einen Brief ans Christking schicken? Wo gibt es ein richtiges Weihnachtspostamt?
-(gesplittet)
Himmelpforten :b) Christhausen :c) Winterberg
richtigeAntwort: a

Süße Nikoläuse heben den Schokoladenkonsum der Deutschen erheblich. Dieser liegt pro Kopf bei
-(gesplittet)
3 kg :b) 7 kg :c) 10 kg im Jahr
richtigeAntwort: c

Aber wie splitte ich jetzt am dümmsten weiter? Habe es mit folgendem Ausdruck probiert:
Code:
test = textDatei.split(".*a\\).*b\\).*c\\)");
Aber da verdrängt er alles was vor dem letzten Ausdruck ".*c\\)" ist.
Wie nennen die Schweizer ein sehr beliebtes sichelförmiges Vanille-Gebäck?
-(gesplittet)
Gipfeli
richtigeAntwort: c

Einen Brief ans Christking schicken? Wo gibt es ein richtiges Weihnachtspostamt?
-(gesplittet)
Winterberg
richtigeAntwort: a

Süße Nikoläuse heben den Schokoladenkonsum der Deutschen erheblich. Dieser liegt pro Kopf bei
-(gesplittet)
10 kg im Jahr
richtigeAntwort: c
Um halt mehrere Sachen zu zerlegen. Wie bekomm ich da mehrere Ausdrück in die Split-Methode?
Und nach einem Zeilenumbruch mit "\\n erledigt auch auch nur bedingt"

Danke wieder mal für eure Hilfe im Voraus!!
 

fjord

Bekanntes Mitglied
Zerlege dir dein Problem am besten in mehrere Teilprobleme.
Die Fragen und Antworten gehören vom Sinn her ja zueinander.
Dazwischen befindet sich immer eine Leerzeile. Also würde ich zuerst dort splitten.
Code:
String[] parts = textDatei.split("\r?\n\r?\n");
Bearbeite jeden dieser Teile für sich alleine mit einer for Schleife.
Du weißt, dass diese Teile aus 3 Zeilen bestehen und auch, dass in der 2. Zeile 3 Antwortmöglichkeiten sind die mit ':' voneinander getrennt sind.

Dass du mit
Code:
test = textDatei.split(".*a\\).*b\\).*c\\)");
soviel Text verlierst liegt daran, dass split den Teil den du angibst entfernt. Dein Teil passt aber auf Antwort a und b.
 
S

SlaterB

Gast
Code:
public class Test
{
    public static void main(String[] args)
        throws Exception
    {
        String textDatei = "a) Himmelpforten :b) Christhausen :c) Winterberg";
        String[] test = textDatei.split(" *a\\) *| *:b\\) *| *:c\\) *");
        System.out.println(Arrays.toString(test));
    }

}
| ist eine Alternative
Leerzeichen* bedeutet, dass die Leerzeichen links und rechts entfernt werden bzw. genauer: mit als Trennzeichen gelten
 

BoZA

Mitglied
Super Jungs, danke euch!!!

Der Code sieht jetzt wie folgt aus:
Code:
private ArrayList<String> antworten = new ArrayList<String>();

private void raetselFragenSplitten()
	{
		if (textDatei != "")
		{
			test = null;
			int zaehler = -3;
			test = textDatei.split("\r?\n");
			for (int loop = 0; loop < test.length; loop++)
			{
				System.out.println(test[loop] + loop);
			}
			for (int loop = 0; loop < test.length; loop++)
			{
				if ((zaehler + 4) < test.length)
				{
					String[] cache = test[zaehler + 4].split(" *a\\) *| *:b\\) *| *:c\\) *");
					for (int loopin = 0; loopin < cache.length; loopin++)
					{
						antworten.add(cache[loopin]);
					}
					String[] cache2 = test[zaehler + 5].split(" *richtigeAntwort: *");
					for (int loopin = 0; loopin < cache2.length; loopin++)
					{
						antworten.add(cache2[loopin]);
					}
					System.out.println(zaehler +4);
					zaehler = zaehler + 4;
				}
			}
			for (int loop = 0; loop < antworten.size(); loop++)
			{
				System.out.println(antworten.get(loop));
			}
		}
	}
Ausgabe:
Wie nennen die Schweizer ein sehr beliebtes sichelförmiges Vanille-Gebäck?0
a) Kipferl :b) Vanille-Hörnli :c) Gipfeli1
richtigeAntwort: c2
3
Einen Brief ans Christking schicken? Wo gibt es ein richtiges Weihnachtspostamt?4
a) Himmelpforten :b) Christhausen :c) Winterberg5
richtigeAntwort: a6
7
Süße Nikoläuse heben den Schokoladenkonsum der Deutschen erheblich. Dieser liegt pro Kopf bei8
a) 3 kg :b) 7 kg :c) 10 kg im Jahr9
richtigeAntwort: c10
11
.
.
.

Und das was in dem ArrayList drin ist:
Kipferl
Vanille-Hörnli
Gipfeli

c

Himmelpforten
Christhausen
Winterberg

a

3 kg
7 kg
10 kg im Jahr

c

Ich muss jetzt euch leider nochmal fragen, wie ich den Space da wegbekomme?!
Gewünschtes Ziel
Kipferl
Vanille-Hörnli
Gipfeli
c
Himmelpforten
Christhausen
Winterberg
a
3 kg
7 kg
10 kg im Jahr
c

Nochmal riesen Dank an euch beide!!
 
S

SlaterB

Gast
> String[] cache = test[zaehler + 4].split(" *a\\) *| *:b\\) *| *:c\\) *")

element 0 des Arrays kannst du ignorieren, bei cache2 wahrscheinlich genauso

oder auch später die Leerzeilen aus der Liste entfernen, ist doch keine schwere Sache
 

BoZA

Mitglied
Code:
private void leereZeichenInListeLöschen()
	{
		for (int loop = 0; loop < antworten.size(); loop++)
		{
			if (antworten.get(loop).equals(""))
			{
				antworten.remove(loop);
			}
		}
	}

Ich bedanke ich bei allen die geholfen haben!!! Danke schön!!!!
 

fjord

Bekanntes Mitglied
Da du im Titel ja auch regex ansprichst, hier mal wie man das auch mit mit einem regex lösen kann.
Auf den ersten Blick sehen regex natürlich ziemlich kryptisch aus, aber wenn man sich damit ein bisschen beschäftigt hat, ist der Code meiner Meinung nach meistens übersichtlicher als wenn man mit mehreren splits arbeitet.
Code:
Pattern p = Pattern.compile(
    "([^\r\n]+)\r?\n" +         // question
    "a\\)([^:]+)" +             // answer a
    ":b\\)([^:]+)" +            // answer b
    ":c\\)([^\r\n]+)\r?\n" +    // answer c
    "richtigeAntwort: ([abc])");// correct answer
Matcher m = p.matcher(textDatei);        
while (m.find()) {
    String question = m.group(1);
    String answerA = m.group(2);
    String answerB = m.group(3);
    String answerC = m.group(4);
    String correct = m.group(5);

    // irgendwas mit den Daten anstellen
}
 

BoZA

Mitglied
Servus, ich mal wieder ^^

Gleiches Thema, nur diesmal ein anderer String. Hoffe es ist okay, wenn ich hier nochmal reinschreibe und das Häckchen untern entferne.

Habe diesmal ein csv Datei. Unabhängig davon, lese ich diese Datei wieder ganz normal ein und drücke es in einen String.
Nur happert es wieder bei dem regEx. Diesmal versuche ich es mit dem pattern.compile() also nicht mit String.split().

Mein Beispiel Daten:
DATEI;BEZEICHNUNG;BESCHREIBUNG;;
576822.jpg;Adam Elsheimer: Die Flucht nach gypten (1609);Vor der Kulisse des...;;
298598.jpg;Adolph von Menzel: Wohnzimmer mit Menzels Schwester (1847);Unabhngig von den...;;
998314.jpg;Albrecht Altdorfer: Susanna im Bade (1526);Anders als sptere Darstellungen...;;

Habe Information abgekürzt, damit der hier nicht ein Scrollbalken bis nach China macht.

Aufgabe ist Klar, 3 Datensätze jeweils getrennt mit einem Semikolon. Der Abschluss bildet ein doppeltes Semikolon.

Mein Ansatz.
Code:
				Pattern p = Pattern.compile(
						"([a-zA-Z0-9\\s\\.]+);" + // bild nummer
						"([a-zA-Z0-9\\s\\.]+);" + // bezeichnung
						"([a-zA-Z0-9\\s\\.]+);;"); // erklaerung
				Matcher match = p.matcher(dateiInhalt);
				while (match.find())
				{
					String bildTmp = match.group(1);
					String bezeichnungTmp = match.group(2);
					String erklaerungTmp = match.group(3);
					csvFile.add(new MeineDaten(bildTmp, bezeichnungTmp, erklaerungTmp)); // Daten zuweisen
				}

Ich habe höchstwahrscheinlich ein Problem mit dem Absatz nach dem dritten Datensatz bei dem das doppelte Semikolon den Abschluß bildet, oder?

Danke für eure hilfe im Voraus!!
 

fjord

Bekanntes Mitglied
Hi,
ich hab deinen Post leider jetzt erst gesehen. Hoffe mal, dass es nicht zu spät ist.
Dein Problem sind nicht die ;;, sondern die Jahreszahlen in den Klammern. Die Klammern sind nämlich nicht Teil deiner Zeichenklasse. Falls du sicher sein kannst, dass in den Feldern deines csv Files keine ; vorkommen, kannst du mit einer negierten Zeichenklasse arbeiten: [^;] statt [a-zA-Z0-9\\s\\.]
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
krgewb String mit Datumsangabe in Long umwandeln Java Basics - Anfänger-Themen 2
D String Groß/Kleinschreibung Ignorieren Java Basics - Anfänger-Themen 4
D Map<String, Integer> sortieren und der reinfolge nach die Glieder abfragen Java Basics - Anfänger-Themen 3
J Ähnlichen String in Liste finden Java Basics - Anfänger-Themen 6
Kartoffel_1 String transformation Java Basics - Anfänger-Themen 7
H String-Operation replace() - Zeichenkette verdoppeln Java Basics - Anfänger-Themen 2
K String analysieren Java Basics - Anfänger-Themen 27
Beowend String zu Date parsen Java Basics - Anfänger-Themen 1
Beowend String auf Satzzeichen überprüfen? Java Basics - Anfänger-Themen 6
H Liste nach String-Länge sortieren Java Basics - Anfänger-Themen 1
String in ArrayList umwandeln Java Basics - Anfänger-Themen 1
I Sass Compiler und String erhalten? Java Basics - Anfänger-Themen 7
Avalon String in Double bzw. Währung konvertieren Java Basics - Anfänger-Themen 6
T Methode akzeptiert String nicht Java Basics - Anfänger-Themen 18
F Arraylist<String>Ein Wort pro Zeile Java Basics - Anfänger-Themen 6
J Schlüsselworte Prüfen, ob ein bestimmtes, ganzes Wort in einem String enthalten ist. Java Basics - Anfänger-Themen 6
N String überprüfen Java Basics - Anfänger-Themen 3
E String zerlegen aus args Java Basics - Anfänger-Themen 1
M Long-Typ in String-Änderung führt zu keinem Ergebnis bei großer Zahl Java Basics - Anfänger-Themen 11
Ostkreuz String Exception Java Basics - Anfänger-Themen 8
W Items löschen aus String Array vom Custom Base Adapter Java Basics - Anfänger-Themen 2
MoxMorris Wie macht man String[] = String[] aus einer anderer Methode? Java Basics - Anfänger-Themen 18
J String Filter Java Basics - Anfänger-Themen 5
S String Array Buchstaben um einen gewissen Wert verschieben Java Basics - Anfänger-Themen 4
R Größter zusammenhängender Block gleicher Zeichen im String Java Basics - Anfänger-Themen 1
XWing Randomizer mit einem String Java Basics - Anfänger-Themen 2
D 2D Char Array into String Java Basics - Anfänger-Themen 2
H Cast von Float nach String klappt nicht Java Basics - Anfänger-Themen 12
I Zerlegen von String Java Basics - Anfänger-Themen 3
B Beliebiger String gegeben Suche Datum in String Java Basics - Anfänger-Themen 6
I String Java Basics - Anfänger-Themen 4
I API - zurückgegebener JSON String lesen und in Entity konvertieren Java Basics - Anfänger-Themen 2
H Zu langen String aufteilen - bequeme Methode? Java Basics - Anfänger-Themen 14
W String einer Textdatei in einzelne Stringobjekte pro Zeile aufteilen Java Basics - Anfänger-Themen 14
belana wie am besten 2D Array von String to Integer Java Basics - Anfänger-Themen 18
J Java To String Methode, Array mit For-Schleife Java Basics - Anfänger-Themen 2
M Kommandozeilenparamter als EINEN String werten Java Basics - Anfänger-Themen 5
M RandomAccessFile int und String gleichzeitig in einer Datei Java Basics - Anfänger-Themen 49
M Prüfen on eine Zahl im String enthalten ist Java Basics - Anfänger-Themen 3
Distanz zwischen zwei Zeichenfolgen in einem String bestimmen Java Basics - Anfänger-Themen 5
Substring in einem String finden Java Basics - Anfänger-Themen 13
BeginnerJava String mit vorgegebener Länge und Buchstaben erzeugen/ mit Leerstellen Java Basics - Anfänger-Themen 8
I Eindeutiger String mit maximaler Anzahl an Zeichen Java Basics - Anfänger-Themen 11
H Interface Wieso "List<String> list = new ArrayList<>[…]" Java Basics - Anfänger-Themen 4
JavaBeginner22 Integer in String umwandeln Java Basics - Anfänger-Themen 7
HolyFUT JSON String in Java Object schreiben - Anführungszeichen rauskriegen? Java Basics - Anfänger-Themen 17
Fodoboo131 RegEx- Umwandlung von String in ausführbares Objekt/ Befehl Java Basics - Anfänger-Themen 9
HolyFUT Input/Output Leerzeichen aus String entfernen - klappt nicht! Java Basics - Anfänger-Themen 13
viktor1 Methoden Methode schreiben static void readText (String filename) {...} zu WordHistogramSample.java Java Basics - Anfänger-Themen 13
ravenz Schleife mit for über String Array „zahlen“und prüfen ob Wert „a“ oder „b“ oder „c“ entspricht (mittels || ) Java Basics - Anfänger-Themen 4
G Position einer unbekannten 3-stelligen-Zahl in einem String finden Java Basics - Anfänger-Themen 15
T String Array Fehler beim Index Java Basics - Anfänger-Themen 3
H Erste Schritte Nach einer Zahl n soll n Mal der String untereinander ausgegeben werden Java Basics - Anfänger-Themen 3
X Datentypen String.equals funktioniert nicht Java Basics - Anfänger-Themen 5
Alen123 String wiederholen mit Schleifen Java Basics - Anfänger-Themen 1
A String split funktioniert nicht, wenn mehr als 1 Ziffer vor dem Zeichen steht nach dem er trennen soll? Java Basics - Anfänger-Themen 4
T String splitten Java Basics - Anfänger-Themen 3
sserio Schwimmen als Spiel. Problem mit to String/ generate a card Java Basics - Anfänger-Themen 4
J Datentypen String in File konvertieren funktioniert nicht Java Basics - Anfänger-Themen 4
T Platzhalter in String? Java Basics - Anfänger-Themen 14
M String mit Variable vergleichen Java Basics - Anfänger-Themen 9
I String Kombination erstellen anhand fortlaufender Zahl (Vertragsnummer) Java Basics - Anfänger-Themen 13
Fats Waller Compiler-Fehler Kann ich einen String und die Summe zweier Char Werte mittels der println Anweisung ausgeben Java Basics - Anfänger-Themen 4
M Wie kann eine Methode (string) eine andere Methode (void) mit zufälligen int-Werten aufrufen? Java Basics - Anfänger-Themen 4
P9cman Vokale in einem String überprüfen mittels Rekursion Java Basics - Anfänger-Themen 8
schredder Strings und reguläre Ausdrücke - Methode mit return string.matches Java Basics - Anfänger-Themen 5
R Ein Multidimensionales String Array initialisieren und Deklarieren Java Basics - Anfänger-Themen 2
H String Repräsentation eines Rechtecks mit Instanz-Methode Java Basics - Anfänger-Themen 8
Dorfschmied Kartesisches Produkt von zwei Liste mit Hashmaps<String,String> erstellen Java Basics - Anfänger-Themen 4
S String mit Int input vergleichen Java Basics - Anfänger-Themen 5
C String/Char-API Java Basics - Anfänger-Themen 13
U Char zu einem String machen Java Basics - Anfänger-Themen 1
B Anzahl Nullen uns Einsen in String ermitteln Java Basics - Anfänger-Themen 3
T Leerzeichen im String entfernen Java Basics - Anfänger-Themen 6
Jose05 Nullpointerexception bei Umwandlung von String zu int Java Basics - Anfänger-Themen 2
O Ich habe einen String und soll mit matches schauen, ob ein Buchstabe zu einer geraden ANzahl im String vorkommt, wie soll das gehen? Java Basics - Anfänger-Themen 7
M String beim einlesen formatieren Java Basics - Anfänger-Themen 12
N null in String replacen Java Basics - Anfänger-Themen 16
R Compiler-Fehler JTable mit XML befüllen | The constructor JTable(Object[], String[]) is undefined Java Basics - Anfänger-Themen 10
M Eclipse kennt keine String Klasse mehr Java Basics - Anfänger-Themen 1
M Frage zur Methode split der Klasse String Java Basics - Anfänger-Themen 32
D String mit int multiplizieren? Java Basics - Anfänger-Themen 16
H Überprüfen ob String Array leer ist Java Basics - Anfänger-Themen 4
A Korrigierte <String> Liste zurückgeben Java Basics - Anfänger-Themen 22
C In String, Buchstaben ersetzen durch andere Buchstaben Java Basics - Anfänger-Themen 26
Poppigescorn String mit mehreren Wörtern füllen? Java Basics - Anfänger-Themen 4
I String Expression mit Java validieren (true / false) Java Basics - Anfänger-Themen 34
B String - Wörter finden, welches Punkt und entsprechender Pre / Suffix hat? Java Basics - Anfänger-Themen 30
T Maximale Anzahl von Konsonanten im String Java Basics - Anfänger-Themen 6
H String verschlüsseln - eigener Algorithmus Java Basics - Anfänger-Themen 104
N Aus einem String die Anzahl der Vokale auslesen Java Basics - Anfänger-Themen 40
J Eintrag Combobox über einen String auswählen Java Basics - Anfänger-Themen 3
K mit String.splitt(",") ganzen Satz erhalten? Java Basics - Anfänger-Themen 3
K Wie String prüfen ob drei mal das gleiche Zeichen vorkommt? Java Basics - Anfänger-Themen 7
I Validation, ob String ein Wert aus einem Enum enthält Java Basics - Anfänger-Themen 3
D String und char in String speichern Java Basics - Anfänger-Themen 5
A ObservableList<String> Java Basics - Anfänger-Themen 6
I String nach Wort suchen Java Basics - Anfänger-Themen 6
I String ersetzen, der Inhalt enthält Java Basics - Anfänger-Themen 4
L ArrayList<String> --> double[] array Java Basics - Anfänger-Themen 18

Ähnliche Java Themen

Neue Themen


Oben