Datei entpacken

HakBak · 12. Jan 2010

Hallo,
ich bekomme tar.gz Dateien, diese möchte ich mit einer Javaklasse entpacken. Ich verwende zum entpacken das Commons.Compress package. Ich hab hier mal was gebastelt:
Hier meine Methode zum entpacken des .gz

Java:

private final int BUFFER = 2048;

System.out.println(new Date() + " - Start extracting: " + file.getName());
                    InputStream  is  = new FileInputStream(file);
                    OutputStream out;
                    out = new FileOutputStream(gzFile.getCanonicalFile() + "\\" +  GzipUtils.getUncompressedFilename(file.getName()));
                    CompressorInputStream in;
                    in = new CompressorStreamFactory().createCompressorInputStream("gz", is);
                    final byte[] buffer = new byte[BUFFER];
                          int    n      = 0;
                    while (-1 != (n = in.read(buffer))) {
                        out.write(buffer, 0, n);
                    }
                    is.close();
                    in.close();

Und nun die Methode zum entpacken des .tar

Java:

InputStream        is    = new FileInputStream("c:\\ftpFiles\\GZ\\" + file.getName());
                    ArchiveInputStream in    = new ArchiveStreamFactory().createArchiveInputStream("tar", is);
                    TarArchiveEntry    entry;
                    while ((entry = (TarArchiveEntry) in.getNextEntry()) != null) {
                        System.out.println(new Date() + " - Extracting: " + entry.getName());
                        OutputStream out = new FileOutputStream(new File(tarFile.getCanonicalFile() + "\\", entry.getName()));
                        IOUtils.copy(in, out);
                        System.out.println(new Date() + " - " + entry.getName() + " has been unzipped");
                        out.close();
                    }
                    in.close();

Das funktioniert auch alles, eigentlich. Aber es dauert irgendwie sehr sehr sehr lange. Ich bekomme eine 70mb tar.gz datei das Tar-Archiv ist dann aber 1,3gb groß. Kann man da vielleicht irgendwas machen, oder den "Algorithmus" ändern, anders schreiben, dass es schneller/besser geht?

RaoulDuke · 12. Jan 2010

Wie lange läuft das Programm denn, und auf was für einem System?

Was mir auffällt ist, das beim Gunzip einen Buffer von nur 2k Grösse benutzt, das erzeugt natürlich massiv unnötigen Overhead, 1,3 GB in 2k Blöcken zu verarbeiten. Also mach den Buffer mal viel viel grösser, vielleicht ein paar MB. Beim Tar entpacken benutzt du IOUtils.copy, benutz das alternativ auch mal beim Gunzip. Gibt ja keinen Grund es einmal so und dann wieder anders zu machen.

Michael... · 12. Jan 2010

Habe mich mit dem Thema noch nie auseinandergesetzt und kenne auch die Klasse IOUtils nicht, aber das

Code:

IOUtils.copy(in, out);

scheint mir nicht zu passen. in ist ein Stream auf das gesamte Archiv, während hier doch nur ein einzelner Eintrag des Archivs herausgeschrieben werden sollte.

RaoulDuke · 12. Jan 2010

Das IOUtils.copy(in, out); macht auch nichts Anderes als den Inhalt eines InputStreams komplett in einen OutputStream zu schreiben, genau das was du mit dem kleinen Buffer auch händisch machst.

IOUtils (Commons IO 1.4 API)

Michael... · 12. Jan 2010

Na, dann würde das ja erklären warum die entpacktend Daten so extrem groß sind.

RaoulDuke · 12. Jan 2010

Wie meinst du das? Das aus 70MB bei nem GUnzip mal 1,3GB rauskommen, wenn es sich um Text handelt, ist nichts Ungewöhnliches. Soll das heissen du weiss noch nichtmal ob die entpacken Daten korrekt entpackt wurden?
Der Code sieht an sich ok aus, er geht jeden Entry des ArchiveInputStreams durch, liest jeden Entry bis zum EOF und packt ihn in einen neue Datei.

Michael... · 12. Jan 2010

Es werden zwar die ganzen Entries durchgegangen, aber in Zeile 4 wird doch in die OutputStreams (die für die Entries gedacht sind) jedes mal das komplette Archiv (in) geschrieben:

Java:

while ((entry = (TarArchiveEntry) in.getNextEntry()) != null) {
    System.out.println(new Date() + " - Extracting: " + entry.getName());
    OutputStream out = new FileOutputStream(new File(tarFile.getCanonicalFile() + "\\", entry.getName()));
    IOUtils.copy(in, out);
    System.out.println(new Date() + " - " + entry.getName() + " has been unzipped");
    out.close();
}

RaoulDuke · 12. Jan 2010

Hmm, stimmt offenbar. Laut der Doku muss man wohl aus dem Entry Objekt die Anzahl Bytes nehmen und diese Anzahl Bytes dann offen verarbeiten:

Commons Compress - Commons Compress Examples

Edit: Das Beispiel benutzt keinen ArchiveInputStream, ich würde also sagen der Code oben müsste funktionieren:

Liest sich in der Doku zu ArchiveInputStream aber irgendwie anders:

ArchiveInputStream (Commons Compress 1.1-SNAPSHOT API)

Archive input streams MUST override the InputStream.read(byte[], int, int) - or read() - method so that reading from the stream generates EOF for the end of data in each entry as well as at the end of the file proper.

The getNextEntry() method is used to reset the input stream ready for reading the data from the next entry.

HakBak · 13. Jan 2010

Hallo,
sorry, dass ich mich erst jetzt melde.
Also bei den gepackten Daten handelt es sich um gezipte (.tar.gz) xml dateien. Deswegen auch die Größe, die dann dabei rauskommt. Ich hab jetzt mal den Buffer erhöht und schau mal was passiert

Also hab das noch mal mit dem Buffer getestet und da ändert sich rein garnix ... das dauert immernoch zu lange ... wenn das File von 7Zip in 2 Minuten ausgepackt wird, werden bei mir in 2 Minuten knapp 1 MB ausgepackt, das kann doch nicht sein.

Vielleicht gibt es noch ne andere Möglichkeit?

tbar0711 · 23. Feb 2010

Hi Hakbak,

ich habe mal versucht mit Deinem Code ein tar-file zu entpacken. Das tar-file enthält bei mir Verzeichnisse und Dateien. Wenn ich das so mache wie du, werden bei mir Verzeichnisse als Dateien entpackt. Wenn dann Unterverzeichnisse entpackt werden, kommt berechtigterweise der Fehler not a directory.

Was muss man also an deinem Code ändern, damit man beim Entpacken eines Tar-files auch Verzeichnisse entpacken kann?

Gruß
Tom

	Titel	Forum	Antworten	Datum
	Installation unter jdk.java.net: Keine ZIP-Datei zum entpacken	Java Basics - Anfänger-Themen	2	25. Okt 2021
C	Encrypted (passwort) Rar Datei entpacken	Java Basics - Anfänger-Themen	42	24. Jan 2016
C	*.jar Datei vor dem Entpacken beschützen	Java Basics - Anfänger-Themen	5	5. Okt 2010
H	Tar.gz Datei entpacken	Java Basics - Anfänger-Themen	2	7. Dez 2009
G	Entpacken einer Zip-Datei	Java Basics - Anfänger-Themen	3	23. Jan 2008
A	Signierte Exe Datei funktioniert nicht mehr	Java Basics - Anfänger-Themen	1	22. Feb 2025
A	Signierte Exe Datei funktioniert nicht mehr	Java Basics - Anfänger-Themen	3	19. Feb 2025
D	wie kann ich gcc aus einer .java datei heraus aufrufen?	Java Basics - Anfänger-Themen	2	24. Dez 2024
	Fehler beim mp4-datei aufrufen, nach dem zweiten aufruf	Java Basics - Anfänger-Themen	1	15. Dez 2024
K	Warum wird hier nur etwas in eine txt Datei geschrieben und nicht in alle drei (InputStream/OutputStream/Reader/Writer)	Java Basics - Anfänger-Themen	1	28. Feb 2024
	Csv Datei in Java einlesen	Java Basics - Anfänger-Themen	18	15. Jan 2024
E	Audio Datei unter Bedingungen ausführen	Java Basics - Anfänger-Themen	19	31. Dez 2023
S	Daten aus Import Datei auslesen und sortieren	Java Basics - Anfänger-Themen	2	6. Nov 2023
A	exe Datei erstellen	Java Basics - Anfänger-Themen	8	4. Okt 2023
G	.jar datei öffnen funktioniert nicht	Java Basics - Anfänger-Themen	17	30. Aug 2023
P	Aus Text Datei nur Zahlen übernehmen	Java Basics - Anfänger-Themen	13	23. Jul 2023
P	Welches SDK für das erstellen einer ausführbaren Datei?	Java Basics - Anfänger-Themen	4	9. Mrz 2023
W	Fehler in der Datei pom.xml	Java Basics - Anfänger-Themen	19	22. Jan 2023
M	Verständnisfrage: Warum wird die Datei ohne Inhalt übertragen	Java Basics - Anfänger-Themen	3	20. Jan 2023
D	Jar Datei startet unter Linux nicht	Java Basics - Anfänger-Themen	3	17. Jan 2023
P	Probleme mit NetBeans: Wie lässt sich jar. Datei an einem MacBook öffnen	Java Basics - Anfänger-Themen	21	16. Jan 2023
N	Programm Funktioniert mit .txt Datei aber nicht mit .rtf Datei	Java Basics - Anfänger-Themen	2	30. Dez 2022
A	Wie führe ich eine Batch-Datei von meiner Java-Anwendung aus?	Java Basics - Anfänger-Themen	18	15. Dez 2022
D	Java Programm mit Batch-Datei starten	Java Basics - Anfänger-Themen	32	8. Dez 2022
W	Objekte einer ArrayList in txt-datei schreiben mit Paths?	Java Basics - Anfänger-Themen	2	5. Okt 2022
E	TIF Datei auslesen	Java Basics - Anfänger-Themen	2	16. Sep 2022
B	von Java/Eclipse verwendete Datei existiert gar nicht?	Java Basics - Anfänger-Themen	6	14. Sep 2022
M	Spezifischen Wert einer Zeile aus .txt Datei entnehmen	Java Basics - Anfänger-Themen	15	14. Sep 2022
B	Popups mit Klicksabfangen zumAusfüllen einer .ods Datei	Java Basics - Anfänger-Themen	0	4. Sep 2022
M	Daten aus .txt Datei einlesen und weiterverarbeiten	Java Basics - Anfänger-Themen	80	1. Sep 2022
M	RandomAccessFile int und String gleichzeitig in einer Datei	Java Basics - Anfänger-Themen	49	19. Aug 2022
I	Datei (Bild) Drucken und wie Druckeinstellung speichern?	Java Basics - Anfänger-Themen	3	8. Jul 2022
G	CSV-Datei Verarbeiten	Java Basics - Anfänger-Themen	8	13. Jun 2022
D	Downloadfortschritt von Datei über Google Drive API v3	Java Basics - Anfänger-Themen	10	7. Jun 2022
A	CSv.Datei einlesen und die werte in zweidemosional Int Array speichern	Java Basics - Anfänger-Themen	9	2. Jun 2022
B	Den Dateipfad einer Java Datei durch Code in Selbiger finden?	Java Basics - Anfänger-Themen	10	27. Mai 2022
S	In Datei schreiben in Java?	Java Basics - Anfänger-Themen	1	24. Apr 2022
	Zeilen einer Datei einlesen	Java Basics - Anfänger-Themen	3	7. Apr 2022
	TXT-Datei Auslesen und den Wert jedes Namen ausrechnen etc.	Java Basics - Anfänger-Themen	37	5. Apr 2022
	Txt Datei einlesen	Java Basics - Anfänger-Themen	9	5. Apr 2022
T	Printwriter Datei nicht überschreiben	Java Basics - Anfänger-Themen	10	29. Mrz 2022
	An selbst ersteller txt Datei immer Text dranhängen, ohne den vorherign Text zu löschen	Java Basics - Anfänger-Themen	8	9. Mrz 2022
	Wie gebe ich den Pfad zu einer Datei an, die in einem Ordner in Eclipse ist?	Java Basics - Anfänger-Themen	1	9. Mrz 2022
D	Strings aus Excel-Datei einlesen	Java Basics - Anfänger-Themen	2	6. Mrz 2022
G	Text in Datei schreiben	Java Basics - Anfänger-Themen	9	26. Feb 2022
S	Datei anlegen Problem! Groß- und Kleinschreibung wird nicht unterschieden	Java Basics - Anfänger-Themen	4	19. Feb 2022
J	selbst erstellte Datei mit Programm öffnen	Java Basics - Anfänger-Themen	10	9. Feb 2022
J	int innerhalb einer Datei ändern	Java Basics - Anfänger-Themen	1	23. Jan 2022
	Text Datei individuell benennen.	Java Basics - Anfänger-Themen	5	16. Jan 2022
	Input/Output .gz bzw. .txt Datei Einlesen und Umgang mit Exceptions	Java Basics - Anfänger-Themen	1	11. Jan 2022
F	Aus eingelesener Datei korrekt Objekte erzeugen	Java Basics - Anfänger-Themen	5	15. Dez 2021
E	extern Datei von meinem Computer aufmachen	Java Basics - Anfänger-Themen	5	15. Dez 2021
H	Scripte oder Programmcode aus Datei lesen?	Java Basics - Anfänger-Themen	5	15. Nov 2021
E	PDF Datei im xfdf-Datei umwandeln und auf dem Laufwerk ablegen	Java Basics - Anfänger-Themen	0	14. Nov 2021
J	CSV-Datei verarbeiten	Java Basics - Anfänger-Themen	27	8. Nov 2021
A	Verarbeiten einer Excel Datei durch das java-Programm	Java Basics - Anfänger-Themen	3	3. Nov 2021
P	Datei einlesen, nach Begriff filtern und in Datei ausgeben. Problem Standardausgabe über Konsole	Java Basics - Anfänger-Themen	19	29. Okt 2021
J	Datei aus Netzwerk auslesen	Java Basics - Anfänger-Themen	9	10. Sep 2021
	hallo habe ein Problem mit einer Datei -> (Zugriff verweigert)	Java Basics - Anfänger-Themen	4	4. Sep 2021
	Controller aus FXML Datei entfernen	Java Basics - Anfänger-Themen	49	3. Sep 2021
I	Probleme mit OutputStream - Datei lässt sich nicht öffnen	Java Basics - Anfänger-Themen	4	5. Aug 2021
	Sqlite DB aus Java Datei ansprechen.	Java Basics - Anfänger-Themen	147	27. Jun 2021
C	XML Datei speichern und laden	Java Basics - Anfänger-Themen	18	24. Jun 2021
M	Von einem Menü Methode aus anderer Klasse ausführen, die errechnete Werte in Datei schreibt.	Java Basics - Anfänger-Themen	8	27. Mai 2021
C	XML Datei schreiben	Java Basics - Anfänger-Themen	14	20. Mai 2021
S	Zufällige ungerade Zeile aus Text-Datei lesen	Java Basics - Anfänger-Themen	5	15. Mai 2021
J	Wert in einer json Datei ändern und speichern	Java Basics - Anfänger-Themen	3	23. Apr 2021
L	Java erstellt leere Datei	Java Basics - Anfänger-Themen	8	14. Apr 2021
J	Json Datei auslesen	Java Basics - Anfänger-Themen	4	11. Mrz 2021
J	In main() Datei geöffnet, von anderer Funktion beschreiben	Java Basics - Anfänger-Themen	3	19. Feb 2021
I	JAX-WS.... Datei ".ical" zurückgeben.... Wie annotieren?	Java Basics - Anfänger-Themen	1	18. Feb 2021
O	zweidimensionales array in eine csv-Datei	Java Basics - Anfänger-Themen	1	9. Feb 2021
	Richtigen Pfad beim einlesen von Datei finden	Java Basics - Anfänger-Themen	2	31. Jan 2021
E	Pfadangaben bei Ausführbarer Jar Datei	Java Basics - Anfänger-Themen	8	30. Jan 2021
J	Input/Output Konstruktor ergänzen, der zur Datei mit einem Objekt passt	Java Basics - Anfänger-Themen	0	23. Jan 2021
I	Datei als Stream aus Ressource laden?	Java Basics - Anfänger-Themen	2	21. Jan 2021
	Methode, die einen arry von objekten speichert in einer datei	Java Basics - Anfänger-Themen	6	19. Jan 2021
R	Wie installiere ich Jdownloadersetup.sh datei mit debian	Java Basics - Anfänger-Themen	2	12. Jan 2021
J	Csv-Datei einlesen	Java Basics - Anfänger-Themen	52	3. Jan 2021
H	Daten aus einer Datei in eine Liste speichern	Java Basics - Anfänger-Themen	23	21. Dez 2020
W	Java in Exe Datei umgewandelt, Ressourcen fehlen (Bilder und Audiodateien)	Java Basics - Anfänger-Themen	1	11. Okt 2020
A	Fehler beim Ausführen einer class Datei	Java Basics - Anfänger-Themen	6	5. Sep 2020
L	Konstruktor für eine Map-Datei/Map-Datei einlesen	Java Basics - Anfänger-Themen	5	23. Jun 2020
S	CSV Datei auslesen und anders darstellen	Java Basics - Anfänger-Themen	2	22. Jun 2020
O	zufälliges Wort aus einer Datei einlesen	Java Basics - Anfänger-Themen	32	8. Jun 2020
E	Input/Output Datei anhand von Dateinamen einlesen	Java Basics - Anfänger-Themen	5	18. Mai 2020
C	Datei über relative Pfade einlesen	Java Basics - Anfänger-Themen	6	18. Mai 2020
F	Auto String mit Array Name aus Datei... oder so ähnlich	Java Basics - Anfänger-Themen	4	27. Apr 2020
O	Best Practice Datei-Pfad zerlegen	Java Basics - Anfänger-Themen	4	3. Apr 2020
N	Java CSV Datei auslesen	Java Basics - Anfänger-Themen	6	21. Mrz 2020
J	Ein Wort aus einer Datei zufällig ermitteln	Java Basics - Anfänger-Themen	3	1. Feb 2020
S	Verbindung von einer Excel Datei zu Java--	Java Basics - Anfänger-Themen	4	25. Jan 2020
G	In Datei schreiben	Java Basics - Anfänger-Themen	1	23. Jan 2020
J	Klassen .class Datei öffnen	Java Basics - Anfänger-Themen	31	19. Jan 2020
P	Datei einlesen und zurückgeben	Java Basics - Anfänger-Themen	5	18. Jan 2020
G	String wird nach Einlesen aus Datei nicht erkannt	Java Basics - Anfänger-Themen	3	5. Jan 2020
G	Problem beim Speichern von Objekten in einer Datei	Java Basics - Anfänger-Themen	7	4. Jan 2020
J	bundel - Datei wird nicht gefunden. Trotz STRG-SHIFT-J	Java Basics - Anfänger-Themen	2	3. Jan 2020
I	ArrayList - Methode zum Speichern eines Eintrags in einer Datei	Java Basics - Anfänger-Themen	17	29. Dez 2019
C	"HelloWorld" - Dateien erstellt, aber ist es eine class-Datei?	Java Basics - Anfänger-Themen	2	29. Dez 2019

Datei entpacken

HakBak

Aktives Mitglied

RaoulDuke

Bekanntes Mitglied

Michael...

Top Contributor

RaoulDuke

Bekanntes Mitglied

Michael...

Top Contributor

RaoulDuke

Bekanntes Mitglied

Michael...

Top Contributor

RaoulDuke

Bekanntes Mitglied

HakBak

Aktives Mitglied

tbar0711

Mitglied

Ähnliche Java Themen

Aktuelle Jobs

Neue Themen