Parser: Datei auslesen, Datei erstellen - Geschwindigkeit

Status
Nicht offen für weitere Antworten.

redbomber

Bekanntes Mitglied
Hi zusammen, ich habe mal eine Frage:

Mein Parser liest Daten aus einer Datei und speichert diese in verschiedenen Datentypen:

Code:
private static LinkedList<String> probeNames = new LinkedList<String>();
private static LinkedList<LinkedList<Double>> allProbeValues= new LinkedList<LinkedList<Double>>();
private static LinkedList<String> chrome = new LinkedList<String>();
private static LinkedList<Double> positions = new LinkedList<Double>();
private static LinkedList<Integer> strand = new LinkedList<Integer>();

Danach schreibe ich die ganzen Daten wieder in eine neue Datei (ich brauch einfach eine spezielle Formatierung)


Das File das ich auslese ist sehr gross (Tabulatorgetrennte Werte etwa 120 MB).

Nun das was mich verwundert:
Das Auslesen der Datei geht sogar noch recht schnell (1-2 Minuten vielleicht).
Aber dann die neue Datei erstellen (wieder eine tabulatorgetrennte Datei) ... da warte ich eeewig. Alle paar Minuten schafft der vielleicht 10.000 Zeilen
(sind insgesamt 120.000 Zeilen).

Woran liegt das? Mache ich irgendwo einen Fehler? Gibt es Unterschiede wie man Daten in ein File schreibt?
Oder dauert das schreiben einfach länger?
 
S

SlaterB

Gast
Schreiben soll schon länger dauern als lesen, aber nicht mehr als 5-10 Min,
(ohne Tests mal eben vermutet),

wenn das Parsen aufwendig ist gegenüber Formatieren zur Datei hin (Strings oder Bytes?), dann kann das Schreiben sogar schneller sein als das Lesen

ohne Code kann man über die Gründe nur raten, zwei Tipps:
1. sparsam Strings zusammensetzten, nicht ständig a = b +c
2. BufferedWriter benutzen, nicht jedes Byte einzeln auf die Festplatte schreiben, sondern nur große Blöcke
 

redbomber

Bekanntes Mitglied
also das dauert bei mir deutlich länger als 5-10 Minuten mehr.


Hier mal mein Code:

Code:
public static void createFile(int experimentNumber) {

		System.out.println("Creating file");
		try {
			String nameOfAnalysisFile = "C:\\Data\\datafile.csv";
			File analysisDataFile = new File(nameOfAnalysisFile);
			analysisDataFile.createNewFile();
			BufferedWriter buffWriter = new BufferedWriter(new FileWriter(
					analysisDataFile));

			// Write comment lines
			buffWriter.write("Id"+"\t");
			for(int i = 1; i <= eNumber; i++){
				buffWriter.write(i + "\t");
			}
			buffWriter.write("Info"+"\n");			
			
			
			// write other lines
			int probeCounter = 0;
			for(String probeName: probeNames){
				// write probe name and experiment values
				buffWriter.write(probeName+"\t");
				LinkedList<Double> values = allProbeValues.get(probeCounter);
					
				for(Double val : values){
					buffWriter.write(val + "\t");
				}
				
				// write lociInfo
				String chromeName = chrome.get(probeCounter);
				Double position = positions.get(probeCounter);
				Integer strandName = strand.get(probeCounter);
				if(strandName == 0){
					buffWriter.write("\"species> " + chromeName + ":" + position.intValue() + "-" + (position.intValue() + 25) +":" + "+\"" + "\n");
				} else if(strandName == 1){
					buffWriter.write("\"species> " + chromeName + ":" + position.intValue() + "-" + (position.intValue() + 25) + ":" + "-\"" + "\n");
				} else {
					System.err.println("Error: strand is neither plus nor minus");
				}

				probeCounter++;
			}
			
			buffWriter.close();

		} catch (Exception e) {
			e.printStackTrace();
		}
	}
 

Wildcard

Top Contributor
Wie gesagt: nio ist wesentlich schneller bei großen Daten, das wird also den größten Unterschied machen.
Wenn du aus irgendeinem Grund kein nio verwenden möchtest, dann vermeide zB solche Dinge:
buffWriter.write(probeName+"\t");
zweimal write ist effizienter als erst zwei String zusammen zu setzen und sie dann zu schreiben
 
S

SlaterB

Gast
bei LinkedList ist es nicht besonders effizient, mit get(index) zuzugreifen,
da muss jedes Mal ganz vorne angefangen und dann die Link-Kette durchlaufen werden,

kann mir vorstellen, dass das bei 120.000 allein schon ne Weile dauert,

such dir testweise einmalig eine feste Menge von Testdaten raus und schreibe die 120.000x hintereinander

für die richtigen Daten verwende dann Iterator,
4 Iterator gleichzeitig zu durchlaufen ist allerdings unschön,

wenn die Daten alle gut zusammenpassen, dann verwende nur EINE LinkedList<MyDataObject>, in MyDataObject sind Name, Double-List usw alles enthalten,
bei nur einer Liste brauchst du dann auch gar keinen Iterator, sondern alternativ eine for-each-Schleife wie du sie derzeit für probeName schon verwendest

---

allein um den Unterschied zu testen, kannst du bei der
> buffWriter.write("Info"+"\n");
Frage auch einfach mal das \n weglassen
 

Ebenius

Top Contributor
Zeile 24 ist wahrscheinlich das schlimmste... Wahlfreier Zugriff auf eine LinkedList. Wandele vorher die LinkedList in eine ArrayList um. Dann wirst Du wahrscheinlich den größten Brocken erledigt haben. Darüber hinaus hat Wildcard natürlich auch noch recht.

[ edit ] Slater, wir sollten uns absprechen. :) Landei auch noch. :lol:
 

Landei

Top Contributor
Code:
LinkedList<Double> values = allProbeValues.get(probeCounter);
Per Index auf LinkedList zuzugreifen ist auch nicht das Wahre, falls selbige etwas größer ist. Teste mal, ob ArrayList da schneller ist, oder nimm Iteratoren.
 

Ariol

Top Contributor
Das sollte schonmal ein paar Punkte in Sachen Geschwindigkeit bringen.
Code:
public static void createFile(int eNumber) {

      System.out.println("Creating file");
      try {
         String nameOfAnalysisFile = "datafile.csv";
         File analysisDataFile = new File(nameOfAnalysisFile);
         analysisDataFile.createNewFile();
         
         StringBuilder sb = new StringBuilder();
         BufferedWriter buffWriter = new BufferedWriter(new FileWriter(
               analysisDataFile));

         // Write comment lines
         sb.append("Id");
         sb.append("\t");
         for(int i = 1; i <= eNumber; i++){
            sb.append(i);
            sb.append("\t");
         }
         sb.append("Info");
         sb.append("\n");         
         buffWriter.write(sb.toString());
         sb.setLength(0);
         
         // write other lines
         int probeCounter = 0;
         for(String probeName: probeNames){
            // write probe name and experiment values
            buffWriter.write(probeName+"\t");
            LinkedList<Double> values = allProbeValues.get(probeCounter);
               
            for(Double val : values){
               sb.append(val);
               sb.append("\t");
            }
            
            // write lociInfo
            String chromeName = chrome.get(probeCounter);
            Double position = positions.get(probeCounter);
            Integer strandName = strand.get(probeCounter);
            if(strandName == 0){
               sb.append("\"species> ");
               sb.append(chromeName);
               sb.append(":");
               sb.append(position.intValue());
               sb.append("-");
               sb.append(position.intValue() + 25);
               sb.append(":");
               sb.append("+\"");
               sb.append("\n");
            } else if(strandName == 1){
              sb.append("\"species> ");
               sb.append(chromeName);
               sb.append(":");
               sb.append(position.intValue());
               sb.append("-");
               sb.append(position.intValue() + 25);
               sb.append(":");
               sb.append("-\"");
               sb.append("\n");
            } else {
               System.err.println("Error: strand is neither plus nor minus");
            }

            buffWriter.write(sb.toString());
            sb.setLength(0);
            
            probeCounter++;
         }
         
         buffWriter.close();

      } catch (Exception e) {
         e.printStackTrace();
      }
   }
 

redbomber

Bekanntes Mitglied
Sorry Ebenius,
ja wie so oft hast du mich auch schon darauf hingewiesen :(

Ich habe jetzt alle LinkedList, auf denen Indexzugriff stattfinden.
Ebenso vermeide ich das zusammensetzen von Strings
und teste gerade das Ergebnis.

Vielen Dank euch allen.


@ didjitalist

Ne eigentlich kann ich von der Datei eine Zeile einlesen
und dann gleich die Zeile umformatiert in die neue Datei ausgeben... stimmt, da könnte ich mir das ganze Durchlaufen der Listen sparen.
Ich dachte zuerst dass ich alle Daten brauche, da ich in jeder zeile eine Wert berechnen muss, dies brauch ich scheins aber doch nicht.
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
F Parser Framework/Plugin für Datei in Custom-Format Allgemeine Java-Themen 2
L Methoden Parser für gängige Datumsformate? Allgemeine Java-Themen 1
W CSV-Parser Allgemeine Java-Themen 1
I DOM-Parser - Element im Element an bestimmten Stellen auslesen Allgemeine Java-Themen 1
L Generator für einen Parser implementieren Allgemeine Java-Themen 13
B StAX Parser - mehrere Methoden, ein XML Allgemeine Java-Themen 4
offi EDIFACT Parser Allgemeine Java-Themen 7
Neumi5694 Parser - Zerlegen verschachtelter Funktionen Allgemeine Java-Themen 2
RalleYTN Lua Parser? Allgemeine Java-Themen 2
O Sax-Parser ließt XML-File doppelt Allgemeine Java-Themen 1
Thallius Simple JSON Parser Error null Allgemeine Java-Themen 6
A Konstrukt ohne Main für Xml-Parser Allgemeine Java-Themen 1
H Best Practice Ideensuche: Flexibel hinzufügbare eigene Parser Allgemeine Java-Themen 6
J Best Practice Parser für Taschenrechner Allgemeine Java-Themen 4
V String nicht im String literal pool speichern - Parser Allgemeine Java-Themen 30
A Parser verursacht Speicherprobleme auf Server Allgemeine Java-Themen 2
P RegEx mit HTML Parser für Java möglich? Allgemeine Java-Themen 10
H Kleiner HTML Parser (Facharbeit) Allgemeine Java-Themen 11
G REST Client / URL Parser Allgemeine Java-Themen 2
F ical4j Parser Allgemeine Java-Themen 7
M String tokenizer / parser Allgemeine Java-Themen 3
M Übergabe mehrer Files an selbstprogrammieren Parser Allgemeine Java-Themen 4
Landei Design-Problem Formel-Parser Allgemeine Java-Themen 10
S HTML => DOM - Welcher Parser für meine Zwecke? Allgemeine Java-Themen 3
E Parser basteln mit CUP Allgemeine Java-Themen 6
T HTML Parser Allgemeine Java-Themen 7
R Script parser Allgemeine Java-Themen 6
T Mathematik Parser Library? Allgemeine Java-Themen 4
N DOM Parser Allgemeine Java-Themen 2
J Parser / Scanner / Tokenizer gesucht Allgemeine Java-Themen 3
S Textfeld Parser sinnvoll? Allgemeine Java-Themen 3
B Parser für logische Ausdrücke Allgemeine Java-Themen 9
D Parser-generator für mathematische Funktionen Allgemeine Java-Themen 12
D CSV Parser Allgemeine Java-Themen 12
T Webseite (HTML) Parser gesucht Allgemeine Java-Themen 8
T Parser für BBCode? Allgemeine Java-Themen 3
S html parser Allgemeine Java-Themen 3
G Parser erstellen Allgemeine Java-Themen 12
T Suche BBCode-Parser in Java Allgemeine Java-Themen 2
A Parser für \ Allgemeine Java-Themen 12
J Java Parser Tool verfügbar? Allgemeine Java-Themen 3
A api latex bzw. latex parser Allgemeine Java-Themen 2
B tipps zum schreiben eines mathematischen parser Allgemeine Java-Themen 13
kodela StatusBar-Anzeigen auch in Log-Datei ausgeben Allgemeine Java-Themen 3
G Maven Projekt JAR-Datei Allgemeine Java-Themen 6
E XML - Datei Darstellung in IntelliJ als Baum Allgemeine Java-Themen 2
Thomasneuling Java Jar datei erstellen, von Projekt, dass auch Javafx Dateien, FXML Dateien und CSS Dateien, sowie Bilder enthält? Allgemeine Java-Themen 14
D Erste Schritte Mp3 Datei kann nicht von der Festplatte geöffnet werden - mit ChatGPT erstellt Allgemeine Java-Themen 7
J Filenotfoundexception obwohl Datei existiert Allgemeine Java-Themen 6
M Java Überprüfen ob .exe-Datei bereits ausgeführt wird Allgemeine Java-Themen 2
S .exe Datei/Programm auslesen? Allgemeine Java-Themen 2
E Datei verschoben Event Allgemeine Java-Themen 3
D Datei mit "Kohsuke GitHub API" in Repository hochladen Allgemeine Java-Themen 2
S Bookmark HTML Datei einlesen, alle Links erhalten und manche editieren..? (aktuell JSoup) Allgemeine Java-Themen 4
melaniemueller Einzelne Zeile aus einer txt Datei in einem String speichern Allgemeine Java-Themen 12
G JavaFX Maven Projekt als .exe Datei exportieren Allgemeine Java-Themen 10
J (Geplante) Änderungen an einer Datei vorübergehend speichern und anwenden? Allgemeine Java-Themen 12
Neumi5694 Datei komprimiert Allgemeine Java-Themen 6
_user_q Obfuscate einer .jar-Datei mit ProGuard? Allgemeine Java-Themen 2
_user_q Verknüpfung einer .jar-Datei (liegt z. B. auf dem Desktop) im Autostart-Ordner erstellen? Allgemeine Java-Themen 20
E java mithilfe url .jar datei öffnen Allgemeine Java-Themen 9
E Java .exe Datei mit args starten Allgemeine Java-Themen 2
W Bilder werden in App mit Jar-Datei nicht angezeigt Allgemeine Java-Themen 15
Master3000 Java Datei mehrmals einlesen Allgemeine Java-Themen 4
M Excel Datei Erstellen Allgemeine Java-Themen 2
E Input/Output Eigene Datei mit java öffnen Allgemeine Java-Themen 9
R Sonderzeichen aus Datei einlesen und in Datei ausgeben. Allgemeine Java-Themen 17
Tobero Download .jar von github lädt kaputte Datei runter Allgemeine Java-Themen 3
P Bat Datei in Java ausführen Allgemeine Java-Themen 2
S Verwendet Programmiersprache aus Quellcode - Datei ermitteln Allgemeine Java-Themen 6
T Problem beim Umwandeln in eine Jar-Datei Allgemeine Java-Themen 3
J Jar-Datei ausführen Allgemeine Java-Themen 7
C Outlook msg-Datei Anhänge extrahieren Allgemeine Java-Themen 2
G Datei aus Ordner wählen, ohne den Dateinamen im Pfad angeben zu müssen Allgemeine Java-Themen 4
G Datei senden via Xmodem an Serial-Port Allgemeine Java-Themen 35
C Wav-Datei aus Jar laden? Allgemeine Java-Themen 11
L Best Practice Zip Datei aktualisieren Allgemeine Java-Themen 1
N Speicherort einer Datei im Explorer ändern Allgemeine Java-Themen 8
H Mehrere PNG-Files in einer Datei Allgemeine Java-Themen 9
Gaudimagspam CSV-Datei auslesen in Java Allgemeine Java-Themen 7
S createTempFile erstellt keine temporäre Datei Allgemeine Java-Themen 13
Hatsi09 Jar datei ausführen verursacht NumberFormatException Allgemeine Java-Themen 9
kodela bestimmten Dateityp immer mit jar-Datei öffnen Allgemeine Java-Themen 17
N Arrayliste in eine Datei speichern Allgemeine Java-Themen 4
B .txt Datei erstellen und auslesen bzw. schreiben Allgemeine Java-Themen 6
J Öffnen eine jar-Datei Allgemeine Java-Themen 11
Dann07 MP3 Datei abspielen funktioniert nicht Allgemeine Java-Themen 6
H ArrayListe in CSV Datei speichern Allgemeine Java-Themen 6
O Aus JAR-Datei erstellte EXE-Datei funktioniert nicht Allgemeine Java-Themen 10
N Txt Datei auslesen. Allgemeine Java-Themen 5
B Datei/Ordner auf Server zugreifen/erstellen Allgemeine Java-Themen 2
MiMa Datei verschieben hat einen Fehler?? Allgemeine Java-Themen 20
MiMa Erstellungsdatum einer Datei Allgemeine Java-Themen 10
O xlsx Datei auslesen mit POI Apache liest keine LEERZELLEN Allgemeine Java-Themen 6
P Input/Output entfernte Datei mit Java öffnen ohne Download Allgemeine Java-Themen 5
O xlsx Datei auslesen mit POI von Apache wirft seltsamen Fehler. Allgemeine Java-Themen 11
J Hilfe, Jar Datei kann nicht ausgeführt werden Allgemeine Java-Themen 2
M Programm erkennt String aus .txt Datei nicht Allgemeine Java-Themen 3
O Java-Applikation tut in Netbeans, als JAR nicht, wegen Pfadangaben einer benötigten Datei Allgemeine Java-Themen 8
J Fehlermeldung bei Ausführung von .jar-Datei Allgemeine Java-Themen 9

Ähnliche Java Themen

Neue Themen


Oben