Datei entpacken

HakBak

Aktives Mitglied
Hallo,
ich bekomme tar.gz Dateien, diese möchte ich mit einer Javaklasse entpacken. Ich verwende zum entpacken das Commons.Compress package. Ich hab hier mal was gebastelt:
Hier meine Methode zum entpacken des .gz
Java:
private final int BUFFER = 2048;

System.out.println(new Date() + " - Start extracting: " + file.getName());
                    InputStream  is  = new FileInputStream(file);
                    OutputStream out;
                    out = new FileOutputStream(gzFile.getCanonicalFile() + "\\" +  GzipUtils.getUncompressedFilename(file.getName()));
                    CompressorInputStream in;
                    in = new CompressorStreamFactory().createCompressorInputStream("gz", is);
                    final byte[] buffer = new byte[BUFFER];
                          int    n      = 0;
                    while (-1 != (n = in.read(buffer))) {
                        out.write(buffer, 0, n);
                    }
                    is.close();
                    in.close();

Und nun die Methode zum entpacken des .tar

Java:
InputStream        is    = new FileInputStream("c:\\ftpFiles\\GZ\\" + file.getName());
                    ArchiveInputStream in    = new ArchiveStreamFactory().createArchiveInputStream("tar", is);
                    TarArchiveEntry    entry;
                    while ((entry = (TarArchiveEntry) in.getNextEntry()) != null) {
                        System.out.println(new Date() + " - Extracting: " + entry.getName());
                        OutputStream out = new FileOutputStream(new File(tarFile.getCanonicalFile() + "\\", entry.getName()));
                        IOUtils.copy(in, out);
                        System.out.println(new Date() + " - " + entry.getName() + " has been unzipped");
                        out.close();
                    }
                    in.close();

Das funktioniert auch alles, eigentlich. Aber es dauert irgendwie sehr sehr sehr lange. Ich bekomme eine 70mb tar.gz datei das Tar-Archiv ist dann aber 1,3gb groß. Kann man da vielleicht irgendwas machen, oder den "Algorithmus" ändern, anders schreiben, dass es schneller/besser geht?
 

RaoulDuke

Bekanntes Mitglied
Wie lange läuft das Programm denn, und auf was für einem System?

Was mir auffällt ist, das beim Gunzip einen Buffer von nur 2k Grösse benutzt, das erzeugt natürlich massiv unnötigen Overhead, 1,3 GB in 2k Blöcken zu verarbeiten. Also mach den Buffer mal viel viel grösser, vielleicht ein paar MB. Beim Tar entpacken benutzt du IOUtils.copy, benutz das alternativ auch mal beim Gunzip. Gibt ja keinen Grund es einmal so und dann wieder anders zu machen.
 

Michael...

Top Contributor
Habe mich mit dem Thema noch nie auseinandergesetzt und kenne auch die Klasse IOUtils nicht, aber das
Code:
IOUtils.copy(in, out);
scheint mir nicht zu passen. in ist ein Stream auf das gesamte Archiv, während hier doch nur ein einzelner Eintrag des Archivs herausgeschrieben werden sollte.
 

RaoulDuke

Bekanntes Mitglied
Wie meinst du das? Das aus 70MB bei nem GUnzip mal 1,3GB rauskommen, wenn es sich um Text handelt, ist nichts Ungewöhnliches. Soll das heissen du weiss noch nichtmal ob die entpacken Daten korrekt entpackt wurden?
Der Code sieht an sich ok aus, er geht jeden Entry des ArchiveInputStreams durch, liest jeden Entry bis zum EOF und packt ihn in einen neue Datei.
 
Zuletzt bearbeitet:

Michael...

Top Contributor
Es werden zwar die ganzen Entries durchgegangen, aber in Zeile 4 wird doch in die OutputStreams (die für die Entries gedacht sind) jedes mal das komplette Archiv (in) geschrieben:
Java:
while ((entry = (TarArchiveEntry) in.getNextEntry()) != null) {
    System.out.println(new Date() + " - Extracting: " + entry.getName());
    OutputStream out = new FileOutputStream(new File(tarFile.getCanonicalFile() + "\\", entry.getName()));
    IOUtils.copy(in, out);
    System.out.println(new Date() + " - " + entry.getName() + " has been unzipped");
    out.close();
}
 

RaoulDuke

Bekanntes Mitglied
Hmm, stimmt offenbar. Laut der Doku muss man wohl aus dem Entry Objekt die Anzahl Bytes nehmen und diese Anzahl Bytes dann offen verarbeiten:

Commons Compress - Commons Compress Examples

Edit: Das Beispiel benutzt keinen ArchiveInputStream, ich würde also sagen der Code oben müsste funktionieren:

Liest sich in der Doku zu ArchiveInputStream aber irgendwie anders:

ArchiveInputStream (Commons Compress 1.1-SNAPSHOT API)

Archive input streams MUST override the InputStream.read(byte[], int, int) - or read() - method so that reading from the stream generates EOF for the end of data in each entry as well as at the end of the file proper.

The getNextEntry() method is used to reset the input stream ready for reading the data from the next entry.
 
Zuletzt bearbeitet:

HakBak

Aktives Mitglied
Hallo,
sorry, dass ich mich erst jetzt melde.
Also bei den gepackten Daten handelt es sich um gezipte (.tar.gz) xml dateien. Deswegen auch die Größe, die dann dabei rauskommt. Ich hab jetzt mal den Buffer erhöht und schau mal was passiert ;)

Also hab das noch mal mit dem Buffer getestet und da ändert sich rein garnix ... das dauert immernoch zu lange ... wenn das File von 7Zip in 2 Minuten ausgepackt wird, werden bei mir in 2 Minuten knapp 1 MB ausgepackt, das kann doch nicht sein.

Vielleicht gibt es noch ne andere Möglichkeit?
 
Zuletzt bearbeitet:

tbar0711

Mitglied
Hi Hakbak,

ich habe mal versucht mit Deinem Code ein tar-file zu entpacken. Das tar-file enthält bei mir Verzeichnisse und Dateien. Wenn ich das so mache wie du, werden bei mir Verzeichnisse als Dateien entpackt. Wenn dann Unterverzeichnisse entpackt werden, kommt berechtigterweise der Fehler not a directory.

Was muss man also an deinem Code ändern, damit man beim Entpacken eines Tar-files auch Verzeichnisse entpacken kann?

Gruß
Tom
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
nbergmann Installation unter jdk.java.net: Keine ZIP-Datei zum entpacken Java Basics - Anfänger-Themen 2
C Encrypted (passwort) Rar Datei entpacken Java Basics - Anfänger-Themen 42
C *.jar Datei vor dem Entpacken beschützen Java Basics - Anfänger-Themen 5
H Tar.gz Datei entpacken Java Basics - Anfänger-Themen 2
G Entpacken einer Zip-Datei Java Basics - Anfänger-Themen 3
K Warum wird hier nur etwas in eine txt Datei geschrieben und nicht in alle drei (InputStream/OutputStream/Reader/Writer) Java Basics - Anfänger-Themen 1
farbenlos Csv Datei in Java einlesen Java Basics - Anfänger-Themen 18
E Audio Datei unter Bedingungen ausführen Java Basics - Anfänger-Themen 19
S Daten aus Import Datei auslesen und sortieren Java Basics - Anfänger-Themen 2
A exe Datei erstellen Java Basics - Anfänger-Themen 8
J .jar datei öffnen funktioniert nicht Java Basics - Anfänger-Themen 17
P Aus Text Datei nur Zahlen übernehmen Java Basics - Anfänger-Themen 13
P Welches SDK für das erstellen einer ausführbaren Datei? Java Basics - Anfänger-Themen 4
W Fehler in der Datei pom.xml Java Basics - Anfänger-Themen 19
M Verständnisfrage: Warum wird die Datei ohne Inhalt übertragen Java Basics - Anfänger-Themen 3
D Jar Datei startet unter Linux nicht Java Basics - Anfänger-Themen 3
P Probleme mit NetBeans: Wie lässt sich jar. Datei an einem MacBook öffnen Java Basics - Anfänger-Themen 21
N Programm Funktioniert mit .txt Datei aber nicht mit .rtf Datei Java Basics - Anfänger-Themen 2
A Wie führe ich eine Batch-Datei von meiner Java-Anwendung aus? Java Basics - Anfänger-Themen 18
D Java Programm mit Batch-Datei starten Java Basics - Anfänger-Themen 32
W Objekte einer ArrayList in txt-datei schreiben mit Paths? Java Basics - Anfänger-Themen 2
E TIF Datei auslesen Java Basics - Anfänger-Themen 2
B von Java/Eclipse verwendete Datei existiert gar nicht? Java Basics - Anfänger-Themen 6
M Spezifischen Wert einer Zeile aus .txt Datei entnehmen Java Basics - Anfänger-Themen 15
B Popups mit Klicksabfangen zumAusfüllen einer .ods Datei Java Basics - Anfänger-Themen 0
M Daten aus .txt Datei einlesen und weiterverarbeiten Java Basics - Anfänger-Themen 80
M RandomAccessFile int und String gleichzeitig in einer Datei Java Basics - Anfänger-Themen 49
I Datei (Bild) Drucken und wie Druckeinstellung speichern? Java Basics - Anfänger-Themen 3
A CSV-Datei Verarbeiten Java Basics - Anfänger-Themen 8
D Downloadfortschritt von Datei über Google Drive API v3 Java Basics - Anfänger-Themen 10
A CSv.Datei einlesen und die werte in zweidemosional Int Array speichern Java Basics - Anfänger-Themen 9
B Den Dateipfad einer Java Datei durch Code in Selbiger finden? Java Basics - Anfänger-Themen 10
S In Datei schreiben in Java? Java Basics - Anfänger-Themen 1
Saiko Zeilen einer Datei einlesen Java Basics - Anfänger-Themen 3
sserio TXT-Datei Auslesen und den Wert jedes Namen ausrechnen etc. Java Basics - Anfänger-Themen 37
sserio Txt Datei einlesen Java Basics - Anfänger-Themen 9
T Printwriter Datei nicht überschreiben Java Basics - Anfänger-Themen 10
berserkerdq2 An selbst ersteller txt Datei immer Text dranhängen, ohne den vorherign Text zu löschen Java Basics - Anfänger-Themen 8
berserkerdq2 Wie gebe ich den Pfad zu einer Datei an, die in einem Ordner in Eclipse ist? Java Basics - Anfänger-Themen 1
D Strings aus Excel-Datei einlesen Java Basics - Anfänger-Themen 2
M Text in Datei schreiben Java Basics - Anfänger-Themen 9
S Datei anlegen Problem! Groß- und Kleinschreibung wird nicht unterschieden Java Basics - Anfänger-Themen 4
J selbst erstellte Datei mit Programm öffnen Java Basics - Anfänger-Themen 10
J int innerhalb einer Datei ändern Java Basics - Anfänger-Themen 1
T208 Text Datei individuell benennen. Java Basics - Anfänger-Themen 5
julian112 Input/Output .gz bzw. .txt Datei Einlesen und Umgang mit Exceptions Java Basics - Anfänger-Themen 1
F Aus eingelesener Datei korrekt Objekte erzeugen Java Basics - Anfänger-Themen 5
E extern Datei von meinem Computer aufmachen Java Basics - Anfänger-Themen 5
H Scripte oder Programmcode aus Datei lesen? Java Basics - Anfänger-Themen 5
E PDF Datei im xfdf-Datei umwandeln und auf dem Laufwerk ablegen Java Basics - Anfänger-Themen 0
J CSV-Datei verarbeiten Java Basics - Anfänger-Themen 27
A Verarbeiten einer Excel Datei durch das java-Programm Java Basics - Anfänger-Themen 3
P Datei einlesen, nach Begriff filtern und in Datei ausgeben. Problem Standardausgabe über Konsole Java Basics - Anfänger-Themen 19
J Datei aus Netzwerk auslesen Java Basics - Anfänger-Themen 9
EchtKeineAhnungManchmal hallo habe ein Problem mit einer Datei -> (Zugriff verweigert) Java Basics - Anfänger-Themen 4
EchtKeineAhnungManchmal Controller aus FXML Datei entfernen Java Basics - Anfänger-Themen 49
I Probleme mit OutputStream - Datei lässt sich nicht öffnen Java Basics - Anfänger-Themen 4
Kotelettklopfer Sqlite DB aus Java Datei ansprechen. Java Basics - Anfänger-Themen 147
C XML Datei speichern und laden Java Basics - Anfänger-Themen 18
M Von einem Menü Methode aus anderer Klasse ausführen, die errechnete Werte in Datei schreibt. Java Basics - Anfänger-Themen 8
C XML Datei schreiben Java Basics - Anfänger-Themen 14
S Zufällige ungerade Zeile aus Text-Datei lesen Java Basics - Anfänger-Themen 5
J Wert in einer json Datei ändern und speichern Java Basics - Anfänger-Themen 3
L Java erstellt leere Datei Java Basics - Anfänger-Themen 8
J Json Datei auslesen Java Basics - Anfänger-Themen 4
J In main() Datei geöffnet, von anderer Funktion beschreiben Java Basics - Anfänger-Themen 3
I JAX-WS.... Datei ".ical" zurückgeben.... Wie annotieren? Java Basics - Anfänger-Themen 1
O zweidimensionales array in eine csv-Datei Java Basics - Anfänger-Themen 1
CptK Richtigen Pfad beim einlesen von Datei finden Java Basics - Anfänger-Themen 2
E Pfadangaben bei Ausführbarer Jar Datei Java Basics - Anfänger-Themen 8
J Input/Output Konstruktor ergänzen, der zur Datei mit einem Objekt passt Java Basics - Anfänger-Themen 0
I Datei als Stream aus Ressource laden? Java Basics - Anfänger-Themen 2
LetsSebi Methode, die einen arry von objekten speichert in einer datei Java Basics - Anfänger-Themen 6
R Wie installiere ich Jdownloadersetup.sh datei mit debian Java Basics - Anfänger-Themen 2
J Csv-Datei einlesen Java Basics - Anfänger-Themen 52
H Daten aus einer Datei in eine Liste speichern Java Basics - Anfänger-Themen 23
W Java in Exe Datei umgewandelt, Ressourcen fehlen (Bilder und Audiodateien) Java Basics - Anfänger-Themen 1
A Fehler beim Ausführen einer class Datei Java Basics - Anfänger-Themen 6
L Konstruktor für eine Map-Datei/Map-Datei einlesen Java Basics - Anfänger-Themen 5
S CSV Datei auslesen und anders darstellen Java Basics - Anfänger-Themen 2
O zufälliges Wort aus einer Datei einlesen Java Basics - Anfänger-Themen 32
E Input/Output Datei anhand von Dateinamen einlesen Java Basics - Anfänger-Themen 5
C Datei über relative Pfade einlesen Java Basics - Anfänger-Themen 6
F Auto String mit Array Name aus Datei... oder so ähnlich Java Basics - Anfänger-Themen 4
O Best Practice Datei-Pfad zerlegen Java Basics - Anfänger-Themen 4
N Java CSV Datei auslesen Java Basics - Anfänger-Themen 6
J Ein Wort aus einer Datei zufällig ermitteln Java Basics - Anfänger-Themen 3
S Verbindung von einer Excel Datei zu Java-- Java Basics - Anfänger-Themen 4
G In Datei schreiben Java Basics - Anfänger-Themen 1
J Klassen .class Datei öffnen Java Basics - Anfänger-Themen 31
P Datei einlesen und zurückgeben Java Basics - Anfänger-Themen 5
G String wird nach Einlesen aus Datei nicht erkannt Java Basics - Anfänger-Themen 3
G Problem beim Speichern von Objekten in einer Datei Java Basics - Anfänger-Themen 7
J bundel - Datei wird nicht gefunden. Trotz STRG-SHIFT-J Java Basics - Anfänger-Themen 2
I ArrayList - Methode zum Speichern eines Eintrags in einer Datei Java Basics - Anfänger-Themen 17
C "HelloWorld" - Dateien erstellt, aber ist es eine class-Datei? Java Basics - Anfänger-Themen 2
A Klassen Datei als Kommandozeilenparameter übergeben Java Basics - Anfänger-Themen 8
J Datei auslesen (nur bestimmte Stellen) Java Basics - Anfänger-Themen 2
B Text-Datei nur in Stream speichern und dann ausgeben Java Basics - Anfänger-Themen 3
G Einbinden von Bildern in ausführbare Jar-Datei Java Basics - Anfänger-Themen 25

Ähnliche Java Themen


Oben