Heapspace out of Memory

Status
Nicht offen für weitere Antworten.

Eddie Irvine

Mitglied
Hallo,

ich habe ein Programm geschrieben, das Heise-Newsmeldungen aus einer DB einliest und in Vektoren umwandelt.

Bei knapp 9.000 Dokumenten funktioniert das auch noch (aber nur mittels -Xmx1024m).

Wenn ich ca. 17.000 Meldungen einlesen will, bekomme ich immer den oben beschriebenen Fehler. Kann ich das irgendwie umgehen? Ich brauch die gebildeten Vektoren zum anschließenden Clustering (d. h. Gruppieren) der Dokumente.
Deswegen kann ich die Vektoren auch nicht in der Datenbank speichern, denn dann wäre das Programm viel zu langsam.

Was kann ich tun?
 
B

Beni

Gast
Die Dokumente vereinfacht darstellen, z.B. nur die ersten 1000 Worte? Füllwörter (und, oder, der, die...) rausschneiden? Oder vielleicht nicht als Text speichern, nur als Map "7 mal kam Wort X vor".
 

Eddie Irvine

Mitglied
Danke für die Antwort.

Stoppwort-Reduktion und Stemming führe ich schon durch.

Meine Vektoren (pro Dokument ein Vektor) werden mittels HashMap realisiert und haben im Allgemeinen nur ca. 35 Einträge.
Dabei ist der Term der Schlüssel und als Wert wird das Gewicht des Terms im jeweiligen Dokument gespeichert.

Das ist die gängige Vorgehensweise.
In der Richtung ist also schon alles soweit wie möglich optimiert (denke ich zumindest)... ;-)
 

Eddie Irvine

Mitglied
Hallo,

weiß niemand eine Möglichkeit, wie ich das Problem beheben kann, ohne dass ich die entsprechenden Daten in die Datenbank schreibe?

DANKE.
 
B

bygones

Gast
klingt ganz nach TextMining... ich bezweifle, dass hier einer die ultimative Lösung anbieten kann, dafür ist das Problem zu komplex und eines der momentan heißesten Forschungsgebiete :)
 

Eddie Irvine

Mitglied
Ja, ist gerade auch mein Forschungsgebiet in meiner Diplomarbeit ;)

Ich will ja nicht wissen, wie ich die Vektoren noch weiter komprimieren kann, sondern nur, ob hier der Arbeitsspeicher die Grenze darstellt.
Dann geb ich halt einfach eine Obergrenze an und gut ist.
 

Illuvatar

Top Contributor
Naja, das ist eben physikalisch beschränkt... selbst wenn du jeden Vektor auf von mir aus 100 Byte komprimieren könntest, und einen Arbeitsspeicher von 8 gig hättest, hättest du immer noch eine Beschränkung, von 85 899 345 Vektoren ;)
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
B Image Matching in Memory Minigame Java Basics - Anfänger-Themen 7
B Memory Spiel Java Basics - Anfänger-Themen 29
J Memory-Spiel Aktivierung der Methode mit Timer Java Basics - Anfänger-Themen 44
Olis Erste Schritte Simples Memory Spiel möglich? Java Basics - Anfänger-Themen 1
Spencer Reid JavaFX Memory Thread.sleep Java Basics - Anfänger-Themen 1
T Art 4 Felder Matrix Memory Java Basics - Anfänger-Themen 2
V Memory Logik Problem/Denkblockade, bitte helft Java Basics - Anfänger-Themen 1
S Java memory fehler: Exception in thread "AWT-EventQueue-0" java.lang.OutOfMemoryError: Java heap spa Java Basics - Anfänger-Themen 5
pinar memory spiel Java Basics - Anfänger-Themen 10
P NullPointerException in Memory-Spiel Java Basics - Anfänger-Themen 5
P Layout Manager - Welches Layout für Memory? Java Basics - Anfänger-Themen 7
A Java memory leakage Java Basics - Anfänger-Themen 9
T Out of Memory (Java Heap Space) Java Basics - Anfänger-Themen 9
S Datentypen Memory Problem Java Basics - Anfänger-Themen 12
I Memory-Spiel Feld nur einmal mischen Java Basics - Anfänger-Themen 2
O Memory Thread.sleep() Java Basics - Anfänger-Themen 5
K Memory-Spiel stecke Fest Java Basics - Anfänger-Themen 2
K Ein Memory Spiel ! Java Basics - Anfänger-Themen 6
K Memory-Spiel alle verdeckte karten aufdecken. Java Basics - Anfänger-Themen 26
T Memory Leak und der Garbage Collector Java Basics - Anfänger-Themen 21
A Memory Probleme beim Laden von thumbnails Java Basics - Anfänger-Themen 3
S memory heap problem Java Basics - Anfänger-Themen 9
J Memory Footprint von Objekten Java Basics - Anfänger-Themen 2
I Memory-Spiel Java Basics - Anfänger-Themen 2
W Servlet - out of memory Java Basics - Anfänger-Themen 7
G Memory-Spiel Java Basics - Anfänger-Themen 8
B Memory - Zufällige Anordnung von Buchstabenpaaren Java Basics - Anfänger-Themen 8
J Memory Java Basics - Anfänger-Themen 2
G Memory Projekt, Fragen über Fragen Java Basics - Anfänger-Themen 6
B Memory in Java Java Basics - Anfänger-Themen 16
T Out of Memory Error Java Basics - Anfänger-Themen 7

Ähnliche Java Themen

Neue Themen


Oben