Problem mit Lesen und Speichern und Verarbeiten von großen Text Dateien

Status
Nicht offen für weitere Antworten.

carknue

Mitglied
Hallo,

ich bin Java Anfänger. Ich habe vorher mit Python auf Symbian Handys programmiert. Nun bin ich auf das Android Handy G1 von Google umgestiegen und möchte mein Programm in Java umschreiben damit es auf Android läuft.

Dabei bin ich nun auf auf folgendes Problem gestoßen. Und zwar muss ich recht große Textdateien einlesen, verarbeiten und speichern. Jede Zeile ist dabei ein Datensatz. Diese Text Dateien sind teilweise 9.5Mb groß und können 57.000 Zeilen haben. Unter Python konnte ich diese Dateien ganz einfach als Liste einlesen, also liste = file.readlines(). Diese Python Liste hat im Hauptspeicher nicht viel mehr Platz belegt wie die Datei groß war. Und ich konnte mit selbgebauter binärer Suche und der eingebauten schnellen sort Methode blitzschnell auf alle Datensätze zugreifen.

Nun habe in in Java noch nicht den vollen Überblick und habe bisher nur die ArrayList entdeckt, die meine Wünsche erfüllen sollte. Zumindest das Verarbeiten geht genauso, wie mit den Python Listen. Direkter Zugriff per index auf die einzelnen Zeilen. Aber die ArrayListen scheinen mehr Speicherplatz im RAM zu belegen. So ist es mir nicht möglich die 9,5MB Datei zu laden, obwohl Android jedem Programm 16 MB zur Verfügung stellt. Das Problem is wohl, dass bei java Strings jeder Character mit 2 Byte gespeichert wird. Also werden die 9,5MB Daten in der ArrayList 19 MB groß und das ist zu viel für Android.

1. Frage wie kann ich die große Datei einlesen, so dass sie im Hauptspeicher nicht wesentlich mehr Speicher belegt? Ich muss die einzelnen Zeilen aber per index aufrufen können, Zeilen löschen oder hinzufügen und sortieren können.

2. Wie speichere ich diese Daten dann wieder möglichst schnell?

Angehängt habe ich den Code, wie ich bisher die Datei in eine Arraylist lade und wieder speicher. Die Speicher Methode funktioniert aber nicht korrekt. Alle Zeilenumbrüche gehen verloren und komische Steuerzeichen werden hinzugefügt. Außerdem dauert das Speichern mit über 30 Sekunden bei einer 3 MB Datei recht lange.

Java:
public void writeFile(final ArrayList<String> liste, String filename) {
         try{
             FileOutputStream fos = new FileOutputStream(filename);
             ObjectOutputStream oos = new ObjectOutputStream(fos);

             oos.writeObject((ArrayList<String>) liste);
             oos.flush();
             fos.close();
             }
             catch(Exception e){}
     }
     
     public static ArrayList<String> loadFile(String fileName)
        {
            if ((fileName == null) || (fileName == ""))
                throw new IllegalArgumentException();
            
            String line;
            ArrayList<String> file = new ArrayList<String>();

            try
            {    
                BufferedReader in = new BufferedReader(new FileReader(fileName));

                if (!in.ready())
                    throw new IOException();

                while ((line = in.readLine()) != null)
                    file.add(line);

                in.close();
            }
            catch (IOException e)
            {
                System.out.println(e);
                return null;
            }

            return file;
        }
 
Zuletzt bearbeitet:

Ark

Top Contributor
Java:
import java.io.*;
import java.util.*;

public class XXX{

	public void writeFile(final ArrayList<String> liste,String filename) throws IOException{
		ObjectOutputStream oos=new ObjectOutputStream(new BufferedOutputStream(new FileOutputStream(filename)));
		oos.writeObject(liste);
		oos.flush();
		oos.close();
	}

	public static ArrayList<String> loadFile(String fileName)
		throws IOException{
		String line;
		ArrayList<String> file=new ArrayList<String>();
		ObjectInputStream in=new ObjectInputStream(new BufferedInputStream(new FileInputStream(fileName)));
		while((line=in.readLine())!=null) file.add(line);
		in.close();
		return file;
	}
}
Vorsicht! Völlig ungetestet; ich bezweifle selbst, dass das viel weiterhilft! Ich glaube sogar, das ist sowieso falsch ...

Die Methode readLine() ist an dieser Stelle aber wohl aus guten Gründen deprecated. Um Ersatz zu finden, müssest du schon genauer darlegen, was du erreichen willst.

Ark

EDIT: Ja, klar, das ist natürlich alles völlig falsch, die beiden Methoden sind ja nicht einmal im Ansatz symmetrisch!

Korrektur folgt, Moment ...
 
Zuletzt bearbeitet:

Ark

Top Contributor
So, zweiter Anlauf:
Java:
import java.io.*;
import java.util.*;

public class XXX{

	public static void writeFile(final ArrayList<String> liste,String filename) throws IOException{
		BufferedWriter bw=new BufferedWriter(new OutputStreamWriter(new FileOutputStream(filename)));
		for(String string:liste) bw.write(string);
		bw.flush();
		bw.close();
	}

	public static ArrayList<String> loadFile(String fileName) throws IOException{
		ArrayList<String> res=new ArrayList<String>();
		BufferedReader in=new BufferedReader(new InputStreamReader(new FileInputStream(fileName)));
		String line;
		while((line=in.readLine())!=null) res.add(line);
		in.close();
		return res;
	}
}
Das sollte wohl mehr in deine Richtung gehen, vermute ich mal. So oder so sieht das aber alles nicht sehr objektorientiert aus; das könnte auf einen Designfehler hindeuten.

Ark
 

carknue

Mitglied
Vielen Dank Ark, habe Deine beiden Vorschläge mal auf dem Handy ausprobiert.

Die writeFile Methode ist wesentlich schneller, nur noch 3 Sekunden, statt vorher fast 30. Das Lesen dauert jetzt sogar länger, als das Speichern ???:L Allerdings fehlen, wie auch in meinem ersten Versuch immer noch alle Zeilenumbrüche, so dass die gespeicherte Datei wertlos wird.

Zum testen lese ich eine original Datei ein und speichere sie sofort wieder ab, die beiden Dateien sollten dann identisch sein, was sie aber bisher nicht sind.

Und dann bleibt noch die Frage, ob man statt einer ArrayList nicht etwas verwenden kann, was speicherschonender ist.
 

faetzminator

Gesperrter Benutzer
ja man kann natürlich nicht
Java:
bw.write(string);
schreiben, sondern muss noch die newline reinnehmen
Java:
bw.write(string.concat(NEW_LINE));
wobei du NEW_LINE wie folgt definierst
Java:
public static final String NEW_LINE = System.getProperty("line.separator");
 

Ark

Top Contributor
@faetzminator: Stimmt, das NewLine-Zeichen habe ich vergessen (danke für den Tipp), lässt sich aber auch prima und wesentlich einfacher nachrüsten. ;)
Java:
for(String string:liste){
	bw.write(string);
	bw.newLine();
}
Ark
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
D Problem beim Lesen einer txt-Datei Java Basics - Anfänger-Themen 8
Z Problem beim Lesen und Schreiben einer Datei Java Basics - Anfänger-Themen 10
H Problem beim lesen des InputStreams von einem Subprozess Java Basics - Anfänger-Themen 4
M line.separator: Problem beim Lesen einer Datei Java Basics - Anfänger-Themen 11
J Problem mit Datei lesen und schreiben Java Basics - Anfänger-Themen 8
E Verständnisfrage/Problem beim lesen mit ObjectInputStream Java Basics - Anfänger-Themen 3
W Problem beim lesen aus Arraylist Java Basics - Anfänger-Themen 2
M Problem mit setText() und lesen von .doc- und .pdf-Dateien Java Basics - Anfänger-Themen 6
K Verständnis Problem bei Server/Client Java Basics - Anfänger-Themen 2
I WildFily - unterschiedliche Libs im Projekt verursachen Problem Java Basics - Anfänger-Themen 11
imocode Vererbung Problem mit Vererbung Java Basics - Anfänger-Themen 2
L Taschenrechner Problem Java Basics - Anfänger-Themen 4
I Applikationsserver (WildFly) - Zugriff auf Ressourcen.. Problem mit Pfade Java Basics - Anfänger-Themen 10
A ScheduledExecutorService problem Java Basics - Anfänger-Themen 7
marcelnedza Problem mit Weltzuweisung, JavaKarol Java Basics - Anfänger-Themen 13
XWing Methoden rückgabe Problem? Java Basics - Anfänger-Themen 6
M Erste Schritte Collatz Problem max int Java Basics - Anfänger-Themen 3
M Problem bei verschachtelter for-Schleife bei zweidimensionalen Arrays Java Basics - Anfänger-Themen 3
C GLOOP Problem beim Erstellen der Kamera Java Basics - Anfänger-Themen 9
nelsonmandela Problem bei Ausgabe einer Switch - Case Funktion Java Basics - Anfänger-Themen 5
frager2345 Problem mit Methode Java Basics - Anfänger-Themen 4
L Problem bei Rechnung mit Math.pow Java Basics - Anfänger-Themen 13
A Thread-Schreibe-Lese-Problem Java Basics - Anfänger-Themen 4
SUPERTJB return Problem Java Basics - Anfänger-Themen 3
sserio BigInteger Problem Java Basics - Anfänger-Themen 4
JordenJost Taschenrechner problem Java Basics - Anfänger-Themen 5
K Problem mit "Random" Java Basics - Anfänger-Themen 5
S Datei anlegen Problem! Groß- und Kleinschreibung wird nicht unterschieden Java Basics - Anfänger-Themen 4
sserio Problem beim Anzeigen Java Basics - Anfänger-Themen 5
xanxk Problem For-Schleife mit Charakter Java Basics - Anfänger-Themen 2
L Unbekanntes Problem mit 2d Array Java Basics - Anfänger-Themen 6
sserio Liste erstellt und ein Problem mit dem Index Java Basics - Anfänger-Themen 8
sserio Schwimmen als Spiel. Problem mit to String/ generate a card Java Basics - Anfänger-Themen 4
J Schleife Problem Java Basics - Anfänger-Themen 2
D Problem mit der Erkennung von \n Java Basics - Anfänger-Themen 2
milan123 das ist meine aufgabe ich hab das problem das bei mir Wenn ich die Richtung der Linien verändern will und drei davon sind richtig, verändere ich die 4 Java Basics - Anfänger-Themen 3
M Verständins Problem bei Aufgabe Java Basics - Anfänger-Themen 4
HeiTim Problem mit der Kommasetzung an der richtigen stelle Java Basics - Anfänger-Themen 59
Temsky34 Problem mit dem Code Java Basics - Anfänger-Themen 17
P Problem mit Calendar.getDisplayName() Java Basics - Anfänger-Themen 8
C Problem mit mehreren Methoden + Scanner Java Basics - Anfänger-Themen 5
P Datei einlesen, nach Begriff filtern und in Datei ausgeben. Problem Standardausgabe über Konsole Java Basics - Anfänger-Themen 19
M Problem mit Klassenverständnis und Button Java Basics - Anfänger-Themen 8
EchtKeineAhnungManchmal hallo habe ein Problem mit einer Datei -> (Zugriff verweigert) Java Basics - Anfänger-Themen 4
H Problem mit Verzweigungen Java Basics - Anfänger-Themen 6
H Problem mit Rückgabewert Java Basics - Anfänger-Themen 7
josfe1234 JAVA FX problem Java Basics - Anfänger-Themen 3
A Code Problem Java Basics - Anfänger-Themen 6
Henri Problem von Typen Java Basics - Anfänger-Themen 7
J Problem mit "ArrayIndexOutOfBoundsException" Java Basics - Anfänger-Themen 11
K jackson Mapping - Problem mit Zeitzonen Java Basics - Anfänger-Themen 10
B Threads Problem mit mehreren Threads Java Basics - Anfänger-Themen 38
I Output BigDecimal anstatt double / Problem beim Rechnen Java Basics - Anfänger-Themen 16
D Schleifen Problem Java Basics - Anfänger-Themen 2
H So viele Fehlermeldungen, dass ich nicht weiß wo das Problem ist. Java Basics - Anfänger-Themen 6
J JAVA-Problem blockiert MEDIATHEKVIEW Java Basics - Anfänger-Themen 13
T Problem mit Lehrzeichen und String bei einfacher Chiffre Java Basics - Anfänger-Themen 8
J extends Problem Java Basics - Anfänger-Themen 2
C Polymorphie-Problem Java Basics - Anfänger-Themen 3
Kalibru Problem bei Ausgabe von Objekt Java Basics - Anfänger-Themen 1
I Format Problem mit Wert - bekomme 0,10 anstatt 10,00 Java Basics - Anfänger-Themen 6
J Problem mit einer Methode die gewissen Inhalt einer Array löschen soll Java Basics - Anfänger-Themen 9
J Problem mit einer Methode, die beliebig viele Objekte in Array speichern soll Java Basics - Anfänger-Themen 6
J Allgemeines Problem mit Klassen Java Basics - Anfänger-Themen 5
U Problem mit dem initialisieren meines Strings in einer Schleife Java Basics - Anfänger-Themen 5
amgadalghabra algorithmisches Problem Java Basics - Anfänger-Themen 19
J Traveling Salesman Problem [Arrays] Java Basics - Anfänger-Themen 9
R ArrayList Problem Java Basics - Anfänger-Themen 6
InfinityDE Problem mit Datenübergabe an Konstruktor Java Basics - Anfänger-Themen 7
C RegEx Problem Java Basics - Anfänger-Themen 4
J Anfänger TicTacToe, Problem bei Gewinnoption, sowohl Unentschieden Java Basics - Anfänger-Themen 8
E Taschenrechner GUI Problem mit Fehlerhandling Java Basics - Anfänger-Themen 6
M Input/Output Fallunterscheidung Problem Java Basics - Anfänger-Themen 17
P Problem beim Überschreiben einer vererbten Methode Java Basics - Anfänger-Themen 4
M Problem bei Ausgabe Java Basics - Anfänger-Themen 7
Splayfer Java Array Problem... Java Basics - Anfänger-Themen 2
G Problem bei der Ausgabe einer Main Claase Java Basics - Anfänger-Themen 7
F Problem mit KeyListener in kombination mit dem ActionListener Java Basics - Anfänger-Themen 4
G Subset sum problem mit Backtracking Java Basics - Anfänger-Themen 18
N Problem mit Scanner Java Basics - Anfänger-Themen 2
J Klassen Problem Java Basics - Anfänger-Themen 8
A Out.format problem. Java Basics - Anfänger-Themen 3
J Problem bei der Programmierung eines Tannenbaums Java Basics - Anfänger-Themen 9
A Array problem Java Basics - Anfänger-Themen 16
2 Taschenrechner mit GUI Problem bei der Berechnung Java Basics - Anfänger-Themen 8
W Remote Method Invocation RMI - Problem Java Basics - Anfänger-Themen 0
I Ich habe ein Problem Java Basics - Anfänger-Themen 3
A Problem bei returnen eines Wertes Java Basics - Anfänger-Themen 6
M Regex Erstellung Problem Java Basics - Anfänger-Themen 2
D Input/Output Problem bei der Benutzereingabe eines Befehls Java Basics - Anfänger-Themen 14
M (Sehr großes Problem) Listen als static in anderen Klassen verwendet Java Basics - Anfänger-Themen 12
F Habe ein problem mit dem ActionListener Java Basics - Anfänger-Themen 3
C Regex-Problem Java Basics - Anfänger-Themen 4
J Problem beim vergleich von zwei Integer Java Basics - Anfänger-Themen 3
M Problem in der Modellierung Java Basics - Anfänger-Themen 20
W Wo ist das URL-Problem ? Java Basics - Anfänger-Themen 1
S Generics-Problem: Class, Class<?>, Class<Object> Java Basics - Anfänger-Themen 4
D FileWriter / FileReader Problem Java Basics - Anfänger-Themen 10
G Problem beim Speichern von Objekten in einer Datei Java Basics - Anfänger-Themen 7
S Compiler-Fehler Exception in thread "main" java.lang.Error: Unresolved compilation problem: Java Basics - Anfänger-Themen 6

Ähnliche Java Themen

Neue Themen


Oben