Wörter aus Datei einlesen

Dramago

Mitglied
Guten Abend,

ich habe die Aufgabe einen Gedichtgenerator zu schreiben. Der Generator an sich funktioniert, es geht nur um das einlesen der Wörter.
Diese sollen aus einer Textdatei mit folgendem vorläufigem Aufbau eingelesen werden:

Code:
:SUBSTANTIVE
Haus
Maus
Katze
:VERBEN
läuft
spielt
:ADJEKTIVE
schön
neu
alt

Es gibt noch mehr Wortarten usw.
Mein erster Ansatz war die Datei zeilenweise auszulesen, dann an den Leerzeichen zu splitten und die Wörter in Listen zu speichern und dann von dort aus weiterverarbeiten.
Jetzt hab ich aber erfahren, dass wir das nicht so machen sollen, denn es könnte ja sein, dass die Datei riesig groß ist und wir uns so den ganzen Arbeitsspeicher voll hauen. Deshalb sollen wir die benötigten Wörter direkt aus der Datei lesen ohne sie nochmals alle zwischenzuspeichern. Es geht halt darum, dass ich immer die benötigte Wortart übergebe und dazu dann ein Wort dieser Wortart aus der Datei zurückbekomme. Habt ihr eine Ahnung wie ich das lösen könnte?

Vielen Dank :)
 

Ruzmanz

Top Contributor
Einfach und sehr unperformant:
- Jede Zeile einlesen die Positionen der Wortarten abspeichern.

Java:
int i = 0;
while ((line = reader.readLine()) != null) {
	if(":SUBSTANTIVE".equals(line)) {
		pos1 = i;
	} else if(":VERBEN".equals(line)) {
		pos2 = i;
	}
}
- Aufgrund irgendeiner Logik kannst du sicherlich im Vorfeld schon sagen, wie viele Verben etc. du brauchen wirst. Wenn die Verben im Bereich 0 bis 42 liegen, lässt du dir X zufällige Zahlen in dem Bereich ausgeben. Wenn die Substantive im Bereich 43 bis 99 liegen, lässt du dir Y zufällige Zahlen in dem Bereich ausgeben.
- Anschließend gehst du nochmal mit der while-Schleife über die Datei und packst die Wörter in ein Array
- Dann baust du dir dein Gedicht zufällig zusammen
 

Dramago

Mitglied
So ähnlich hatte ich das auch, aber es wäre theoretisch möglich, dass auch die ganze Datei in einer Zeile steht. Und ich kann auch nicht vorher sagen wie viele Verben und so es sein werden, das müsste ich dann irgendwie aus der Datei berechnen. Was mir noch einfällt ist vor jedes Wort ein Trennzeichen zu machen...
 

strußi

Top Contributor
oder du machst drei ArrayList<String> auf und speicherst das zeug einfach da rein, damit hast du den wenigsten ärger

du kannst die gesammte Zeile einlesen und mittels des scanners schaun ob mehr als ein wort in der zeile steht, dann aufteilen und die nächste zeile einlesen, teste, wortweise in die arraylist packen, wenn es eine andere wortart ist, die passende arraylist nehmen und die wörter hinzuschreiben, ...
 

Dramago

Mitglied
Das ist ja gerade das Problem, dass ich alle Wörter zu keiner Zeit speichern soll, sondern ein Wort direkt aus der Datei holen und verarbeiten und dass nächste auch wieder aus der Datei.
 

strußi

Top Contributor
hab ich es richtig verstanden, dass du folgendes machen willst

benutzer sagt:
gib mit substantiv und du liest einfach das oberste aus deiner Datei ein und löscht dieses anschließend? um so an das nächste zu kommen?

sonst kannst du so was auch machen indem du nur die ersten 10 von jeder wortart einliest und aus der datei schmeißt, und sobald nur noch 2 oder 3 drin sind, kannst du automatisch nachladen. Wenn ein wort aus einer liste verwendet wird, schmeißt du es raus. damit kommst du nur selten an die ram-grenze
 

Dramago

Mitglied
Nein, so sollte das nicht funktionieren. Ich versuchs nochmal etwas verständlicher zu machen:

Ich habe eine Klasse bzw. mehrere Klassen, die aus einer gegebene Vokabelliste ein zufällig erzeugtes Gedicht erstellen sollen. Der Satzbau und so weiter ist alles vorgegeben. Jetzt brauch ich eine Klasse "FileHandler" oder so, welche eine Methode besitzt, zB.: "getWort(int wortart)", welche ich in der "Generator"-Klasse aufrufe und die mir dann zu einer gegebenen Wortart ein zufälliges Wort zurückgibt. Diese Methode soll also in der Datei ein Wort der gesuchten Wortart finden und es zurückgeben. Dabei soll nur dieses eine Wort gespeichert werden und nicht alle Wörter aus der Datei, oder einer Wortart. Ich darf auch nicht eine ganze Zeile einlesen, da es ja theoretisch möglich ist, dass die ganze Datei in einer Zeile steht.
Meine Idee war es jetzt verschiedene Delimiter einzufügen, die vor jedem Wort stehen und so. aber wie kann ich das dann realisieren, dass ich ein zufälliges Wort der gegebenen Wortart bekomme und nicht immer nur das erste? Das Problem ist ja auch, dass es vollkommen variable ist, wie viele Wörter pro Wortart in der Datei stehen.
Wenn das erstmal alles funktioniert muss es dann auch noch möglich sein, ein Wort mit bestimmter Wortart und bestimmter Endung zu finden. Das sollte aber keine Problem sein, denn wenn die Endung nicht passt wird die Suche einfach wiederholt usw.
 

Ruzmanz

Top Contributor
Meine Idee war es jetzt verschiedene Delimiter einzufügen, die vor jedem Wort stehen und so. aber wie kann ich das dann realisieren, dass ich ein zufälliges Wort der gegebenen Wortart bekomme und nicht immer nur das erste? Das Problem ist ja auch, dass es vollkommen variable ist, wie viele Wörter pro Wortart in der Datei stehen.

Ich möchte nur nochmal auf meinen Ansatz verweisen. Du musst die komplette Datei parsen (entspricht NICHT im RAM speichern) und dir die Anzahl der Wörter pro Wortart merken. Natürlich brauchst du einen Delimiter. Wenn die Wörter nicht Zeilenweise in der Datei stehen musst du diese Byte-Weise einlesen, siehe Hinweis mit RandomAccessFile.

1. Ganze Datei durchlaufen und folgende Werte auslesen:
int[] woerter mit [5, 45, 90, 4, ...] // 5 Nomen, dann kommen 45 Verben, dann 90 positve Wörter, usw.

2. Wenn du ein zufälliges Verb suchst, dann rufst du zufall = new Random.nextInt(woerter[1]) = 2 auf.

3. Jetzt musst du die Datei nochmal durclaufen und wenn du am (woerter[0] + zufall)ten (z.B. 7) Wort angekommen bist, dann nimmst du den Wert und brichst das Einlesen der Datei ab.

... Kann man optimieren, wenn man es erstmal zum laufen gebracht hat.
 
Zuletzt bearbeitet:

Dramago

Mitglied
Super, vielen Dank für deine Antwort :)

Das werde ich so umsetzen.

Wenn ich die Datei byteweise durchlaufe, wie mach ich dass denn am geschicktesten, weil ich lese doch immer nur eine bestimmte Anzahl von Bytes auf einmal ein und was ist wenn ich dann ein Wort zerteile, also wenn nach der Hälfte der Einlesepuffer voll ist?
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
AGW in Java-Code plötzlich ein paar Wörter in Rot Allgemeine Java-Themen 2
C Kürzeste Wörter bestimmen Allgemeine Java-Themen 8
K Java Standardbib/reservierte Wörter erweitern Allgemeine Java-Themen 1
B Java Audio in Wörter/Phonems aufteilen Allgemeine Java-Themen 0
OlafHD Prozentualer Abgleich von zweit Sätzen/Wörter Allgemeine Java-Themen 5
J Mehrere Wörter getrennt in eine Array einlesen, wie ? Allgemeine Java-Themen 7
B Per Buttonklicks einer Liste Wörter hinzufügen - Wie umsetzen? Allgemeine Java-Themen 11
K Wörter in Strings zählen Allgemeine Java-Themen 7
S Speichern/Laden/Hinzufügen/Löschen der Array-Wörter; unerwartete Ausgabe Allgemeine Java-Themen 6
T Wörter Vergleichen Allgemeine Java-Themen 3
G Regulärer Ausdruck für 2 Wörter Allgemeine Java-Themen 3
D Wort in Text mit >100.000 Wörter finden Allgemeine Java-Themen 7
S Wörter ohne Leerzeichen erkennen Allgemeine Java-Themen 5
J Neue Wörter bilden Allgemeine Java-Themen 10
L Textdatei nach Wörter durchsuchen Allgemeine Java-Themen 3
J String Wörter zählen Allgemeine Java-Themen 4
M Wörter Algorithmus Allgemeine Java-Themen 7
M JTextPane Mausklick auf bestimmte Wörter startet Aktion Allgemeine Java-Themen 8
S Wörter ersetzen mit regex Allgemeine Java-Themen 11
kodela StatusBar-Anzeigen auch in Log-Datei ausgeben Allgemeine Java-Themen 3
G Maven Projekt JAR-Datei Allgemeine Java-Themen 6
E XML - Datei Darstellung in IntelliJ als Baum Allgemeine Java-Themen 2
Thomasneuling Java Jar datei erstellen, von Projekt, dass auch Javafx Dateien, FXML Dateien und CSS Dateien, sowie Bilder enthält? Allgemeine Java-Themen 14
D Erste Schritte Mp3 Datei kann nicht von der Festplatte geöffnet werden - mit ChatGPT erstellt Allgemeine Java-Themen 7
J Filenotfoundexception obwohl Datei existiert Allgemeine Java-Themen 6
M Java Überprüfen ob .exe-Datei bereits ausgeführt wird Allgemeine Java-Themen 2
S .exe Datei/Programm auslesen? Allgemeine Java-Themen 2
E Datei verschoben Event Allgemeine Java-Themen 3
D Datei mit "Kohsuke GitHub API" in Repository hochladen Allgemeine Java-Themen 2
S Bookmark HTML Datei einlesen, alle Links erhalten und manche editieren..? (aktuell JSoup) Allgemeine Java-Themen 4
melaniemueller Einzelne Zeile aus einer txt Datei in einem String speichern Allgemeine Java-Themen 12
G JavaFX Maven Projekt als .exe Datei exportieren Allgemeine Java-Themen 10
J (Geplante) Änderungen an einer Datei vorübergehend speichern und anwenden? Allgemeine Java-Themen 12
Neumi5694 Datei komprimiert Allgemeine Java-Themen 6
_user_q Obfuscate einer .jar-Datei mit ProGuard? Allgemeine Java-Themen 2
_user_q Verknüpfung einer .jar-Datei (liegt z. B. auf dem Desktop) im Autostart-Ordner erstellen? Allgemeine Java-Themen 20
E java mithilfe url .jar datei öffnen Allgemeine Java-Themen 9
E Java .exe Datei mit args starten Allgemeine Java-Themen 2
W Bilder werden in App mit Jar-Datei nicht angezeigt Allgemeine Java-Themen 15
Master3000 Java Datei mehrmals einlesen Allgemeine Java-Themen 4
M Excel Datei Erstellen Allgemeine Java-Themen 2
E Input/Output Eigene Datei mit java öffnen Allgemeine Java-Themen 9
R Sonderzeichen aus Datei einlesen und in Datei ausgeben. Allgemeine Java-Themen 17
Tobero Download .jar von github lädt kaputte Datei runter Allgemeine Java-Themen 3
P Bat Datei in Java ausführen Allgemeine Java-Themen 2
S Verwendet Programmiersprache aus Quellcode - Datei ermitteln Allgemeine Java-Themen 6
T Problem beim Umwandeln in eine Jar-Datei Allgemeine Java-Themen 3
J Jar-Datei ausführen Allgemeine Java-Themen 7
C Outlook msg-Datei Anhänge extrahieren Allgemeine Java-Themen 2
G Datei aus Ordner wählen, ohne den Dateinamen im Pfad angeben zu müssen Allgemeine Java-Themen 4
G Datei senden via Xmodem an Serial-Port Allgemeine Java-Themen 35
C Wav-Datei aus Jar laden? Allgemeine Java-Themen 11
L Best Practice Zip Datei aktualisieren Allgemeine Java-Themen 1
N Speicherort einer Datei im Explorer ändern Allgemeine Java-Themen 8
H Mehrere PNG-Files in einer Datei Allgemeine Java-Themen 9
Gaudimagspam CSV-Datei auslesen in Java Allgemeine Java-Themen 7
S createTempFile erstellt keine temporäre Datei Allgemeine Java-Themen 13
Hatsi09 Jar datei ausführen verursacht NumberFormatException Allgemeine Java-Themen 9
kodela bestimmten Dateityp immer mit jar-Datei öffnen Allgemeine Java-Themen 17
N Arrayliste in eine Datei speichern Allgemeine Java-Themen 4
B .txt Datei erstellen und auslesen bzw. schreiben Allgemeine Java-Themen 6
J Öffnen eine jar-Datei Allgemeine Java-Themen 11
Dann07 MP3 Datei abspielen funktioniert nicht Allgemeine Java-Themen 6
H ArrayListe in CSV Datei speichern Allgemeine Java-Themen 6
O Aus JAR-Datei erstellte EXE-Datei funktioniert nicht Allgemeine Java-Themen 10
N Txt Datei auslesen. Allgemeine Java-Themen 5
B Datei/Ordner auf Server zugreifen/erstellen Allgemeine Java-Themen 2
MiMa Datei verschieben hat einen Fehler?? Allgemeine Java-Themen 20
MiMa Erstellungsdatum einer Datei Allgemeine Java-Themen 10
O xlsx Datei auslesen mit POI Apache liest keine LEERZELLEN Allgemeine Java-Themen 6
P Input/Output entfernte Datei mit Java öffnen ohne Download Allgemeine Java-Themen 5
O xlsx Datei auslesen mit POI von Apache wirft seltsamen Fehler. Allgemeine Java-Themen 11
J Hilfe, Jar Datei kann nicht ausgeführt werden Allgemeine Java-Themen 2
M Programm erkennt String aus .txt Datei nicht Allgemeine Java-Themen 3
O Java-Applikation tut in Netbeans, als JAR nicht, wegen Pfadangaben einer benötigten Datei Allgemeine Java-Themen 8
J Fehlermeldung bei Ausführung von .jar-Datei Allgemeine Java-Themen 9
J Die Letzte Zahl aus einer Text datei lesen Allgemeine Java-Themen 8
Elyt Compiler-Fehler Datei kann nicht erstellt werden. Die Syntax für den Dateinamen etc. ist falsch. Allgemeine Java-Themen 2
M Probleme jar datei. Allgemeine Java-Themen 2
F Datei in String-Array einlesen Allgemeine Java-Themen 8
O docx-Datei erzeugung mit DocXStamper funktioniert nicht Allgemeine Java-Themen 2
T Objekt mit String und Int aus TxT Datei erstellen Allgemeine Java-Themen 23
Bluedaishi Prüfen ob Datei noch geöffnet ist Allgemeine Java-Themen 59
I Temp-Datei wird nicht gelöscht Allgemeine Java-Themen 12
D ODS.Datei öffnet leider in Excel Allgemeine Java-Themen 3
L JavaFX JavaFX Chart in Apache Poi Excel Datei Allgemeine Java-Themen 2
D .txt Datei in .jar Datei speichern Allgemeine Java-Themen 3
ralfb1105 Blöcke aus Datei filtern/suchen und in neue Datei schreiben Allgemeine Java-Themen 10
M Daten aus MatLab Datei lesen Allgemeine Java-Themen 8
L SQL Datei in Eclipse erstellen Allgemeine Java-Themen 3
Drachenbauer Wie sorge ich dafür, dass mein Spiel die ini-Datei in der Resourcen-ordner des Projektes schreibt? Allgemeine Java-Themen 5
Trèfle Excel-Datei nicht speicherbar, da von Java zum Bearbeiten gesperrt. Allgemeine Java-Themen 3
N Datei Zeilenweise Einlesen, Versteckte Zeichen Allgemeine Java-Themen 5
L Excel Datei löscht sich selbst im Programm - Java Allgemeine Java-Themen 3
G Workupload datei mit Java Downloaden Allgemeine Java-Themen 6
H .jar Datei startet nicht richtig bei Doppelklick Allgemeine Java-Themen 11
S Hilfe bei dem Auslesen einer YAML Datei Allgemeine Java-Themen 8
M Java Eclipse- Datei exportieren Allgemeine Java-Themen 5
R jar-Datei funktioniert nicht Allgemeine Java-Themen 2
R .txt Datei einlesen und auf der Konsole ausgeben lassen Allgemeine Java-Themen 11

Ähnliche Java Themen

Neue Themen


Oben