Wie Datei effizient auslesen?

zero-2-one · 4. Mai 2009

Ich habe zu meinem aktuellen Projekt in den letzten Tagen zwar schon häufiger Fragen gestellt, aber ich habe eben festgestellt, dass ich meine bisherige Strategie wohl über den Haufen werfen muss...

Darum nochmal ein paar/viele grundlegende Fragen die ich so ähnlich schonmal gestellt habe:

Ich muss eine größere Menge (zwischen 20 MB und 200 MB) an Daten aus einer Datei auslesen. Prinzipiell handelt es sich hier hauptsächlich um 16bit signed Integerwerte allerdings habe ich auch noch andere Dateien aus denen ich Daten auslesen muss welche double, String, char, boolean, etc. sein können (signed und unsigned). Das ganze liegt in Byteform entweder in BigEndian oder in LittleEndian vor (welcher Fall vorliegt kann erst festgestellt werden wenn die Datei geöffnet wurde) und ich weis bei welchem Offset welcher Wert stehen müsste.
Ich habe schon mit DataInputStream rumprobiert, musste mir dort allerdings selbst Methoden schreiben um mit LittleEndian klar zu kommen oder unsigned datentypen richtig auszulesen. Außerdem habe ich mir immer eine byte[] mit benötigter größe erstellt um mittels DataInputStream.read(byte[]) und String(byte[]) beispielsweise einen String auslesen zu können - falls es eine Klasse von Java gibt bei der ich offset, Länge und datentyp angeben könnte wäre das klasse.
Mein zweiter Ansatz war einen FileInputStream in einen BufferedInputStream zu stecken (das hab ich aber nur irgendwo aufgeschnappt und selbst nicht so 100% verstanden) um die ganze Datei dann in ein byte[] zu speichern und dann mit dieser byte[] weiter zu arbeiten. Da ich allerdings ziemlich große Dateien habe und zum Großteil auch noch rekursiv bei der auswertung vorgehe (ich übergebe große teilstücke dieser byte[] beim nächsten aufruf der methode) bekomme ich ziemlich schnell ein Speicherproblem und das Programm stürzt ab. Schnell ist im Übrigen auch nicht das richtige Wort, da es doch 5 bis 10 Minuten dauert bis ich die OutOfMemoryException (oder so ähnlich) bekomme. Ich denke mal das meine Idee das ganze in eine byte[] zu kopieren und auch noch mehrfach zu kopieren schuld sein könnte. Kann ich nicht irgendwie einfach angeben ab welchem Offset in der Datei ein gewisse Anzahl von Bytes ausgelesen werden soll? Naja, ist ja auf die selbe Frage wie vorher rausgelaufen.

Mein zweiter Punkt ist eher eine Designfrage für meine Daten. Viele meiner Daten lassen sich gut in einer Baumstruktur darstellen, allerdings enthalten nur die Knoten der selben Tiefe die gleichen Daten. Geht man Tiefer in den Baum müssen also andere Parameter ausgelesen werden. Außerdem möchte ich das ganze gerne variabel halten, da meine Daten die ich auslesen will in verschiedenen Versionen existieren (die Aufzeichen-Software hat sich in den letzten 10 Jahre weiter entwickelt). Bisher habe ich das so gelöst, dass ich aus einer Textdatei eine Art Schablone für jeden Knoten auslese und dann nach dieser Schablone meine Werte in eine ArrayList<String[]> schreibe. Die Schablone ist eignetlich nur eine Auflistung meiner Parameter, der jeweilge Datentyp und die Anzahl der zu lesenden Bytes in meiner eigntlichen auszuwertenden Datei. In den String[] meiner ArrayList steht dann immer der Name des Parameters, der ausgelsene Wert dieses Parameters aus meiner Datei und der Datentyp des Parameters (da ich den String später ja konvertieren muss). Das Zugreifen auf einen bestimmten Parameter eines Knoten ist auf diese Weise allerdings etwas nervig, da das bei einer Baumtiefe von vier z.B. so aussieht:

Wurzel.get(nummerEinesKindes).get(nummerEinesKindesKindes).get(nummerEinesKindesKindesKindes).listeDerParamter

Dann muss ich diese Liste nach dem richtigen Parameter durchsuchen, den Datentyp auslesen und den Wert von einem String in den entsprechenden Datentypen umwandeln. Das suchen und umwandeln kann ich auch nicht durch eine Methode der Klasse erledigen lassen, da ich ja verschieden Datentypen bei der Rückgabe haben kann.

Es wäre ja schon gut wenn ich irgendwie komfortabler einen beliebigen Knoten in meinem Baum aufrufen könnte aber mir fehlt irgendwie die zündende Idee

Ich habe hier mal was von IDs gelesen allerding habe ich nicht so die Vorstellung davon wie ich das machen soll, da bei mir der Vaterknoten nur über seine Kinder bescheid weis aber nicht über seine Enkel. Die ID eines Enkels wäre daher für den Vater nicht aussagekräftig.

Um es ein bisschen anschaulicher zu machen versuche ich hier mal noch ein Beispiel zu basteln:

Root
|__ Versionsnummer (Parameter / int)
|__ Anzahl Kinder (Parameter / int)
|__ Name des Knoten (Parameter / String)
|__ ArrayList von Kindern________________________________________ ...
-----|__ Name (Parameter / String) -------|__ Name (Parameter / String)
-----|__ Nummer (Parameter / int) --------|__ Nummer (Parameter / int)
-----|__ Strom (Parameter / double) ------|__ Strom (Parameter / double)
-----|__ Spannung (Parameter / double) --|__ Spannung (Parameter / double)
-----... ----------------------------------...
-----|__ ArrayList von Kindern ------------|__ ArryList von Kindern
----------|_______________________... -------|_______ ...
----------|__ -------|__ -------|__
----------|__ -------|__ -------|__

so sieht die Struktur etwa aus. Die Parameter können bei einer anderen Ausgangsdatei im selben Knoten allerdings wieder anders aussehen (nur Knoten der selben Tiefe aus ein und der selben Datei sehen in jedem Fall identisch aus abgesehen von der Anzahl der Kinder). Aus diesem Grund stehen alle als "Parameter" gekennzeichneten Werte zur Zeit auch in einer zweiten ArrayList vom Typ String[] (wie oben im Text beschrieben).

Entschuldigung das ich meine Probleme nicht besser beschreiben kann und ich hoffe, dass diejenigen unter euch, die es bis hier her geschafft haben vieleicht die ein oder andere Anregung für mich haben.

Danke schonmal...

Marco13 · 4. Mai 2009

Die Sache mit der Datenstruktur müßte man sich nochmal genauer ansehen.

Aber zur Frage der Verarbeitung an sich kannst du dir mal den NIO-Kram "in der Nähe von" FileChannel (Java 2 Platform SE v1.4.2) ansehen. Ehrlich gesagt habe ich damit selbst noch nicht gearbeitet, aber damit sollte es möglich sein, ein Stück von einer Datei in den Speicher zu mappen und dort als ByteArray anzusehen - und DEN kann man wiederum in einen FloatArray oder so einwickeln, wo man auch mit der Big/Little-Endian-Order rumhantieren kann (siehe ByteBuffer (Java 2 Platform SE v1.4.2)) ... vielleicht hilft's ja als Ansatz oder möglicher Ausgangspunkt für weitere Tests.

BTW: Bei einer rekursiven Auswertung sollte man eigentlich (wenn die Auswertung, wie der Name suggeriert, wirklich den Array nur LIEST) immer denSELBEN Array in die nächste Rekursionsstufe üebrgeben können, und ggf. nur einen angepassten start- und end-Index für den in dieser Rekursionsstufe relevanten Bereich des Arrays mit übergeben müssen.

	Titel	Forum	Antworten	Datum
	Datei effizient kopieren	Java Basics - Anfänger-Themen	18	8. Mrz 2006
K	Warum wird hier nur etwas in eine txt Datei geschrieben und nicht in alle drei (InputStream/OutputStream/Reader/Writer)	Java Basics - Anfänger-Themen	1	28. Feb 2024
	Csv Datei in Java einlesen	Java Basics - Anfänger-Themen	18	15. Jan 2024
E	Audio Datei unter Bedingungen ausführen	Java Basics - Anfänger-Themen	19	31. Dez 2023
S	Daten aus Import Datei auslesen und sortieren	Java Basics - Anfänger-Themen	2	6. Nov 2023
A	exe Datei erstellen	Java Basics - Anfänger-Themen	8	4. Okt 2023
J	.jar datei öffnen funktioniert nicht	Java Basics - Anfänger-Themen	17	30. Aug 2023
P	Aus Text Datei nur Zahlen übernehmen	Java Basics - Anfänger-Themen	13	23. Jul 2023
P	Welches SDK für das erstellen einer ausführbaren Datei?	Java Basics - Anfänger-Themen	4	9. Mrz 2023
W	Fehler in der Datei pom.xml	Java Basics - Anfänger-Themen	19	22. Jan 2023
M	Verständnisfrage: Warum wird die Datei ohne Inhalt übertragen	Java Basics - Anfänger-Themen	3	20. Jan 2023
D	Jar Datei startet unter Linux nicht	Java Basics - Anfänger-Themen	3	17. Jan 2023
P	Probleme mit NetBeans: Wie lässt sich jar. Datei an einem MacBook öffnen	Java Basics - Anfänger-Themen	21	16. Jan 2023
N	Programm Funktioniert mit .txt Datei aber nicht mit .rtf Datei	Java Basics - Anfänger-Themen	2	30. Dez 2022
A	Wie führe ich eine Batch-Datei von meiner Java-Anwendung aus?	Java Basics - Anfänger-Themen	18	15. Dez 2022
D	Java Programm mit Batch-Datei starten	Java Basics - Anfänger-Themen	32	8. Dez 2022
W	Objekte einer ArrayList in txt-datei schreiben mit Paths?	Java Basics - Anfänger-Themen	2	5. Okt 2022
E	TIF Datei auslesen	Java Basics - Anfänger-Themen	2	16. Sep 2022
B	von Java/Eclipse verwendete Datei existiert gar nicht?	Java Basics - Anfänger-Themen	6	14. Sep 2022
M	Spezifischen Wert einer Zeile aus .txt Datei entnehmen	Java Basics - Anfänger-Themen	15	14. Sep 2022
B	Popups mit Klicksabfangen zumAusfüllen einer .ods Datei	Java Basics - Anfänger-Themen	0	4. Sep 2022
M	Daten aus .txt Datei einlesen und weiterverarbeiten	Java Basics - Anfänger-Themen	80	1. Sep 2022
M	RandomAccessFile int und String gleichzeitig in einer Datei	Java Basics - Anfänger-Themen	49	19. Aug 2022
I	Datei (Bild) Drucken und wie Druckeinstellung speichern?	Java Basics - Anfänger-Themen	3	8. Jul 2022
A	CSV-Datei Verarbeiten	Java Basics - Anfänger-Themen	8	13. Jun 2022
D	Downloadfortschritt von Datei über Google Drive API v3	Java Basics - Anfänger-Themen	10	7. Jun 2022
A	CSv.Datei einlesen und die werte in zweidemosional Int Array speichern	Java Basics - Anfänger-Themen	9	2. Jun 2022
B	Den Dateipfad einer Java Datei durch Code in Selbiger finden?	Java Basics - Anfänger-Themen	10	27. Mai 2022
S	In Datei schreiben in Java?	Java Basics - Anfänger-Themen	1	24. Apr 2022
	Zeilen einer Datei einlesen	Java Basics - Anfänger-Themen	3	7. Apr 2022
	TXT-Datei Auslesen und den Wert jedes Namen ausrechnen etc.	Java Basics - Anfänger-Themen	37	5. Apr 2022
	Txt Datei einlesen	Java Basics - Anfänger-Themen	9	5. Apr 2022
T	Printwriter Datei nicht überschreiben	Java Basics - Anfänger-Themen	10	29. Mrz 2022
	An selbst ersteller txt Datei immer Text dranhängen, ohne den vorherign Text zu löschen	Java Basics - Anfänger-Themen	8	9. Mrz 2022
	Wie gebe ich den Pfad zu einer Datei an, die in einem Ordner in Eclipse ist?	Java Basics - Anfänger-Themen	1	9. Mrz 2022
D	Strings aus Excel-Datei einlesen	Java Basics - Anfänger-Themen	2	6. Mrz 2022
M	Text in Datei schreiben	Java Basics - Anfänger-Themen	9	26. Feb 2022
S	Datei anlegen Problem! Groß- und Kleinschreibung wird nicht unterschieden	Java Basics - Anfänger-Themen	4	19. Feb 2022
J	selbst erstellte Datei mit Programm öffnen	Java Basics - Anfänger-Themen	10	9. Feb 2022
J	int innerhalb einer Datei ändern	Java Basics - Anfänger-Themen	1	23. Jan 2022
	Text Datei individuell benennen.	Java Basics - Anfänger-Themen	5	16. Jan 2022
	Input/Output .gz bzw. .txt Datei Einlesen und Umgang mit Exceptions	Java Basics - Anfänger-Themen	1	11. Jan 2022
F	Aus eingelesener Datei korrekt Objekte erzeugen	Java Basics - Anfänger-Themen	5	15. Dez 2021
E	extern Datei von meinem Computer aufmachen	Java Basics - Anfänger-Themen	5	15. Dez 2021
H	Scripte oder Programmcode aus Datei lesen?	Java Basics - Anfänger-Themen	5	15. Nov 2021
E	PDF Datei im xfdf-Datei umwandeln und auf dem Laufwerk ablegen	Java Basics - Anfänger-Themen	0	14. Nov 2021
J	CSV-Datei verarbeiten	Java Basics - Anfänger-Themen	27	8. Nov 2021
A	Verarbeiten einer Excel Datei durch das java-Programm	Java Basics - Anfänger-Themen	3	3. Nov 2021
P	Datei einlesen, nach Begriff filtern und in Datei ausgeben. Problem Standardausgabe über Konsole	Java Basics - Anfänger-Themen	19	29. Okt 2021
	Installation unter jdk.java.net: Keine ZIP-Datei zum entpacken	Java Basics - Anfänger-Themen	2	25. Okt 2021
J	Datei aus Netzwerk auslesen	Java Basics - Anfänger-Themen	9	10. Sep 2021
	hallo habe ein Problem mit einer Datei -> (Zugriff verweigert)	Java Basics - Anfänger-Themen	4	4. Sep 2021
	Controller aus FXML Datei entfernen	Java Basics - Anfänger-Themen	49	3. Sep 2021
I	Probleme mit OutputStream - Datei lässt sich nicht öffnen	Java Basics - Anfänger-Themen	4	5. Aug 2021
	Sqlite DB aus Java Datei ansprechen.	Java Basics - Anfänger-Themen	147	27. Jun 2021
C	XML Datei speichern und laden	Java Basics - Anfänger-Themen	18	24. Jun 2021
M	Von einem Menü Methode aus anderer Klasse ausführen, die errechnete Werte in Datei schreibt.	Java Basics - Anfänger-Themen	8	27. Mai 2021
C	XML Datei schreiben	Java Basics - Anfänger-Themen	14	20. Mai 2021
S	Zufällige ungerade Zeile aus Text-Datei lesen	Java Basics - Anfänger-Themen	5	15. Mai 2021
J	Wert in einer json Datei ändern und speichern	Java Basics - Anfänger-Themen	3	23. Apr 2021
L	Java erstellt leere Datei	Java Basics - Anfänger-Themen	8	14. Apr 2021
J	Json Datei auslesen	Java Basics - Anfänger-Themen	4	11. Mrz 2021
J	In main() Datei geöffnet, von anderer Funktion beschreiben	Java Basics - Anfänger-Themen	3	19. Feb 2021
I	JAX-WS.... Datei ".ical" zurückgeben.... Wie annotieren?	Java Basics - Anfänger-Themen	1	18. Feb 2021
O	zweidimensionales array in eine csv-Datei	Java Basics - Anfänger-Themen	1	9. Feb 2021
	Richtigen Pfad beim einlesen von Datei finden	Java Basics - Anfänger-Themen	2	31. Jan 2021
E	Pfadangaben bei Ausführbarer Jar Datei	Java Basics - Anfänger-Themen	8	30. Jan 2021
J	Input/Output Konstruktor ergänzen, der zur Datei mit einem Objekt passt	Java Basics - Anfänger-Themen	0	23. Jan 2021
I	Datei als Stream aus Ressource laden?	Java Basics - Anfänger-Themen	2	21. Jan 2021
	Methode, die einen arry von objekten speichert in einer datei	Java Basics - Anfänger-Themen	6	19. Jan 2021
R	Wie installiere ich Jdownloadersetup.sh datei mit debian	Java Basics - Anfänger-Themen	2	12. Jan 2021
J	Csv-Datei einlesen	Java Basics - Anfänger-Themen	52	3. Jan 2021
H	Daten aus einer Datei in eine Liste speichern	Java Basics - Anfänger-Themen	23	21. Dez 2020
W	Java in Exe Datei umgewandelt, Ressourcen fehlen (Bilder und Audiodateien)	Java Basics - Anfänger-Themen	1	11. Okt 2020
A	Fehler beim Ausführen einer class Datei	Java Basics - Anfänger-Themen	6	5. Sep 2020
L	Konstruktor für eine Map-Datei/Map-Datei einlesen	Java Basics - Anfänger-Themen	5	23. Jun 2020
S	CSV Datei auslesen und anders darstellen	Java Basics - Anfänger-Themen	2	22. Jun 2020
O	zufälliges Wort aus einer Datei einlesen	Java Basics - Anfänger-Themen	32	8. Jun 2020
E	Input/Output Datei anhand von Dateinamen einlesen	Java Basics - Anfänger-Themen	5	18. Mai 2020
C	Datei über relative Pfade einlesen	Java Basics - Anfänger-Themen	6	18. Mai 2020
F	Auto String mit Array Name aus Datei... oder so ähnlich	Java Basics - Anfänger-Themen	4	27. Apr 2020
O	Best Practice Datei-Pfad zerlegen	Java Basics - Anfänger-Themen	4	3. Apr 2020
N	Java CSV Datei auslesen	Java Basics - Anfänger-Themen	6	21. Mrz 2020
J	Ein Wort aus einer Datei zufällig ermitteln	Java Basics - Anfänger-Themen	3	1. Feb 2020
S	Verbindung von einer Excel Datei zu Java--	Java Basics - Anfänger-Themen	4	25. Jan 2020
G	In Datei schreiben	Java Basics - Anfänger-Themen	1	23. Jan 2020
J	Klassen .class Datei öffnen	Java Basics - Anfänger-Themen	31	19. Jan 2020
P	Datei einlesen und zurückgeben	Java Basics - Anfänger-Themen	5	18. Jan 2020
G	String wird nach Einlesen aus Datei nicht erkannt	Java Basics - Anfänger-Themen	3	5. Jan 2020
G	Problem beim Speichern von Objekten in einer Datei	Java Basics - Anfänger-Themen	7	4. Jan 2020
J	bundel - Datei wird nicht gefunden. Trotz STRG-SHIFT-J	Java Basics - Anfänger-Themen	2	3. Jan 2020
I	ArrayList - Methode zum Speichern eines Eintrags in einer Datei	Java Basics - Anfänger-Themen	17	29. Dez 2019
C	"HelloWorld" - Dateien erstellt, aber ist es eine class-Datei?	Java Basics - Anfänger-Themen	2	29. Dez 2019
A	Klassen Datei als Kommandozeilenparameter übergeben	Java Basics - Anfänger-Themen	8	26. Dez 2019
J	Datei auslesen (nur bestimmte Stellen)	Java Basics - Anfänger-Themen	2	18. Dez 2019
B	Text-Datei nur in Stream speichern und dann ausgeben	Java Basics - Anfänger-Themen	3	14. Dez 2019
G	Einbinden von Bildern in ausführbare Jar-Datei	Java Basics - Anfänger-Themen	25	17. Nov 2019
G	If / While Programm (Datei auslesen)	Java Basics - Anfänger-Themen	6	5. Nov 2019
M	Java: BufferedReader liest nur die Hälfte der Text-Datei.	Java Basics - Anfänger-Themen	4	24. Okt 2019
T	PNG Datei wird nur manchmal geöffnet	Java Basics - Anfänger-Themen	6	19. Okt 2019

Wie Datei effizient auslesen?

zero-2-one

Mitglied

Marco13

Top Contributor

Ähnliche Java Themen

Aktuelle Jobs

Neue Themen