Effizienteres Speichern von Worten

b1zarRe

Bekanntes Mitglied
Hi,

Folgender Pseudocode:

Java:
//Lese Text einer Textdatei zeilenweise ein
(...)

//Zerstückel einzelne Wörter, welche einen Trenner wie (" .,;: etc") haben
(...)

//Solange noch Tokens vorhanden
//Füge Token in eine ArrayList
while(st.hasMoreTokens()) {
  String token = st.nextToken();
  al.add(token);
}


Meine Frage ist nun, ob es effizienter wäre mithilfe einer HashMap ODER eines
Hashsets und eine Liste zu arbeiten: Würde dies nicht speichersparender sein?
Ungefähr so:

Java:
//Lese Text einer Textdatei zeilenweise ein
(...)

//Zerstückel einzelne Wörter, welche einen Trenner wie (" .,;: etc") haben
(...)

//Solange noch Tokens vorhanden
//Prüfe ob Token in Hashmap ist
//Falls ja, adde diesen der Arraylist
//Falls nein, erzeuge eine neue Schlüssel-Wert Beziehung und füge den Wert ein
while(st.hasMoreTokens()) {
   String token = st.nextToken();
   if(hm.containsKey(token) {
      al.add(hm.get(token));
   } else {
     hm.put(token, token);
     al.add(token);
  }
}

Denke ich da korrekt? Vorher wurden einfach nur Tokens in die Arraylist abgelegt...
nun aber, werden quasi alle tokens mit einer hashmap zugewiesen: Sprich: Wenn
ein token bereits zugewiesen wurde, dann war dieser in genau der Form schonmal
im Text vorhanden, also kann ich doch einfach eine Referenz an die Stelle stellen?

Ist dies korrekt gedacht, oder unfug?
 

Tente

Mitglied
Ich denke es ist deine absicht bereits vorhandene Wörter nochmals hinzuzufügen, sonst macht es keinen Sinn was du geschrieben hast!?

Trotzdem ist deine Methode so äußerst ineffizient. Du hälst dir den String in deiner HashMap, um zu prüfen ob Wörter die auftreten bereits einmal aufgetreten sind, um dann die gleiche Referenz in die ArrayList schreiben zu können. Daraus ergeben sich 2 Fragen:

1. Ist es so wichtig, dass es die gleiche Referenz ist? Wenn man sauber mit equals prüft sollte das doch eigentlich immer nahezu egal sein.. Gleiche Buchstaben sind gleiche Buchstaben.

2. Warum speicherst du überhaupt doppelt? Ich kenne jetzt natürlich nur den Ausschnitt deines Codes. Ich verstehe es aber so, dass du das Wort brauchst und das eben so häufig wie es aufgetreten ist. Da wäre es viel sinnvoller das Wort als Key in der HashMap zu verwenden und als Value die Anzahl.. über das EntrySet kannst du iterieren und du kommst über HashMap-Methoden effizient an deine String Referenzen. So sparst du dir das doppelte Speichern der Strings.
 
Zuletzt bearbeitet:

b1zarRe

Bekanntes Mitglied
Naja, dass hat, denke ich folgenden Vorteil:
(Es geht darum Textdateien mit Sätzen auszulesen)

Wenn ich nur eine ArrayList benutze, dann wird jeder Token gespeichert UND
die Reihenfolge bliebe erhalten. NUR: Es kann natürlich sein, dass ein Wort wie
"und" oder "der" etc. x-mal im Satz vorkommen.

Deshalb die Frage, ob es nicht speichereffizienter wäre, mit
einer HashMap zu prüfen, ob das Wort bereits aufgenommen wurde, falls
nein, dann eine Zuordnung zu schaffen, falls ja, genau die Referenz (und nicht neuen String)
in die ArrayListe abzulegen.

Ein Set würde demnach wegfallen weil ich ja den Satz rekonstruieren/lesen möchte... Gleiches
für eine reine HashMap.


Anders ausgedrückt: Ich möchte einen Text in Wörtertokens zerlegen, speichereffizienter als
bei einer reinen ArrayListe, aber sodass man diese Sätze rekonstruieren kann !
 

Tente

Mitglied
Die Reihenfolge ist natürlich ein schlagendes Argument. Es ist schwer zu sagen ob es speichereffizieter ist. Ich würde es einfach ausprobieren und das Speicherverhalten beobachten.
 

freez

Top Contributor
Da du die Sätze rekonstruieren möchtest, brauchst du die Information wo das Wort steht. Somit könntest du einerseits ein HashSet verwenden mit dem Wort, welches nur einmal vorhanden wäre und eine Liste / Array, wo du die Referenz zu dem Wort aus dem HashSet in die richtige Reihenfolge bringst. Allerdings hast du hier eine Liste mit Referenzen als Overhead und je nach Text kann es sein, dass du Speicher sparst, oder mehr Speicher brauchst. Bei einfachen Texten mit vielen Wiederholungen und einfachen Wörtern hast du Spareffekte und bei komplizierter Fachliteratur wirst du wohl wenig sparen, oder sogar drauflegen. Ein Test mit verschiedenen Texten könnte es zeigen.

Du könntest auch versuchen den Text vorher an bestimmten Stellen zu analysieren und daraufhin die entsprechende Speichertechnik verwenden.
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
OnDemand Zugangsdaten externer Systeme sicher speichern Allgemeine Java-Themen 8
Z Passwort Versuche speichern Allgemeine Java-Themen 8
M Eigene Datenstruktur um eine Menge zu speichern Allgemeine Java-Themen 3
8u3631984 Bilder in Datenbank speichern - sinnvoll Allgemeine Java-Themen 5
melaniemueller Einzelne Zeile aus einer txt Datei in einem String speichern Allgemeine Java-Themen 12
I Hibernate Envers - Aufruf der Methode zum Speichern selbst ausführen oder managen? Allgemeine Java-Themen 0
killig Textdatei einlesen und in HashMap speichern (duplikate entfernen) Allgemeine Java-Themen 12
J (Geplante) Änderungen an einer Datei vorübergehend speichern und anwenden? Allgemeine Java-Themen 12
N zweidimensionalen Array in dreidimensionalen Array speichern Allgemeine Java-Themen 4
temi Lösung zum Speichern von Deltafiles Allgemeine Java-Themen 6
J Java Filechooser Speichern Allgemeine Java-Themen 8
N Arrayliste in eine Datei speichern Allgemeine Java-Themen 4
H Elemente aus ArrayList in Array speichern Allgemeine Java-Themen 8
platofan23 Wie .txtDatei im Java Eclipse-Projekt bzw. in der Jar speichern? Allgemeine Java-Themen 7
MiMa Werte in liste speichern? Allgemeine Java-Themen 3
S Swing Speichern nach Button-Klick Allgemeine Java-Themen 5
H ArrayListe in CSV Datei speichern Allgemeine Java-Themen 6
H Mehrere Datentypen in einer Arraylist speichern Allgemeine Java-Themen 9
H Objekte speichern und laden Allgemeine Java-Themen 10
H Objekte speichern und laden Allgemeine Java-Themen 1
H Objekt speichern und laden Allgemeine Java-Themen 1
H Objekt speichern und laden Allgemeine Java-Themen 1
T Speichern von Objekten Allgemeine Java-Themen 2
M Schnelleres Speichern von XML-Daten über URLConnection Allgemeine Java-Themen 4
D .txt Datei in .jar Datei speichern Allgemeine Java-Themen 3
M Key-File im selben Ordner speichern? Allgemeine Java-Themen 18
J int Werte in einer anderen Klasse in Arrays speichern Allgemeine Java-Themen 3
Aruetiise Funktion(y = mx+n) in String speichern und berechnen Allgemeine Java-Themen 9
S Eindimensionales Array in zweidimensionales Array speichern Allgemeine Java-Themen 5
offi Excel mit Inhalten aus DB öffnen ohne zu speichern Allgemeine Java-Themen 8
MiMa Speichern von Programmeinstellungen in Datei Allgemeine Java-Themen 7
F Best Practice Große Anzahl an Objekten speichern und lesen Allgemeine Java-Themen 19
B Von String zu <Objekt> ||Speichern/Laden Allgemeine Java-Themen 17
Arif Input/Output Dateien im Jar-Programm speichern Allgemeine Java-Themen 12
Q-bert Strings aus der JList in eine Datenbank speichern Allgemeine Java-Themen 1
L CSV File lesen, in ArrayList speichern und ausgeben Allgemeine Java-Themen 3
Q-bert Daten von Java Programm speichern Allgemeine Java-Themen 4
@SupressWarnings() Feste Kosten speichern Allgemeine Java-Themen 4
N ZIp datei direkt im eclipse speichern Allgemeine Java-Themen 4
N Das Ende von bestimmten zeilen in text datei ändern und speichern Allgemeine Java-Themen 3
C Best Practice Speichern kleineren Mengen Stammdaten? Allgemeine Java-Themen 3
X Mehrere booleans in Datei Speichern, Updaten und Laden Allgemeine Java-Themen 1
F Json in sql speichern und lesen Allgemeine Java-Themen 10
F Alte Passörter mit Gson und Json in SQL speichern? Allgemeine Java-Themen 5
K API-Key sicher speichern Allgemeine Java-Themen 2
K Große Mengen an Daten speichern Allgemeine Java-Themen 9
B Zahlen manuell eingeben und in Array Speichern Allgemeine Java-Themen 2
K Input/Output String aus einer Datei einlesen und in anderer Datei speichern Allgemeine Java-Themen 20
Tacofan Bilder in Resource speichern Allgemeine Java-Themen 6
C Objekte in Array List speichern? Allgemeine Java-Themen 1
OnDemand Objekte speichern Allgemeine Java-Themen 8
O Klassen Bruch im gleichen Objekt Speichern Allgemeine Java-Themen 1
J Text lesen und in Variablen speichern Allgemeine Java-Themen 3
U Variablen Stringarrays mit wenig verschiedenen Zeichen effizienter speichern Allgemeine Java-Themen 10
HarleyDavidson Input/Output Heruntergeladene Datei direkt nach dem Download öffnen ohne zu speichern Allgemeine Java-Themen 1
J Daten persistent speichern Allgemeine Java-Themen 14
S JavaMail - MailSubject,MailFrom,MailDate in String Array speichern NullPointerException Allgemeine Java-Themen 2
M Objekt serialisieren/deserialisieren und in einer SQLite-Datenbank speichern Allgemeine Java-Themen 3
R HtmlUnit: Canvas als Bild speichern Allgemeine Java-Themen 0
E KeyCode in anderer Klasse speichern Allgemeine Java-Themen 2
M YouTube-Video herunterladen und speichern Allgemeine Java-Themen 10
C Position speichern von verschiebbaren Elementen auf JPanel Allgemeine Java-Themen 3
S Wertepaar in LinkedList/PriorityQueue speichern Allgemeine Java-Themen 3
Developer_X Input/Output Serialisiertes Objekt speichern und laden Allgemeine Java-Themen 1
J Arraylist speichern und laden? Allgemeine Java-Themen 5
S speichern von RSA-Keys Allgemeine Java-Themen 1
3 OOP Instanzen aus einer Klasse persistent speichern. Allgemeine Java-Themen 9
GUI-Programmer Mp3 Dateien bearbeiten und speichern Allgemeine Java-Themen 3
G Suchweg durch Binärbaum speichern Allgemeine Java-Themen 4
D IP-Cam live stream speichern Allgemeine Java-Themen 9
javampir Lange Bitfolge speichern Allgemeine Java-Themen 3
M Methoden in Rescources speichern Allgemeine Java-Themen 4
L iText PDF-Generierung ohne Speichern Allgemeine Java-Themen 10
U Screenshot erstellen und speichern Allgemeine Java-Themen 6
OnDemand Input/Output Variablen in Datei Speichern um sie wieder auszulesen Allgemeine Java-Themen 4
M Werte aus DB in Liste speichern ohne mehrfach speicherung Allgemeine Java-Themen 18
S XML lesen, verarbeiten, speichern klappt in Eclipse, aber nicht in der JAR Allgemeine Java-Themen 4
H JPA (EclipseLink) Neuer Eintrag in Collection speichern (unidirektional) Allgemeine Java-Themen 3
J RC4 Key als String speichern? Allgemeine Java-Themen 5
F Java Api Bilder speichern Allgemeine Java-Themen 3
T UTF-16LE String aus LDAP lesen und als ISO-8859-1 in DB speichern? Allgemeine Java-Themen 2
M Einstellungen in JAR speichern Allgemeine Java-Themen 8
F Problem beim Speichern eines Attachments Allgemeine Java-Themen 3
K Input/Output Daten speichern / laden Allgemeine Java-Themen 2
M Best Practice: Daten aufnehmen-speichern-bereitstellen Allgemeine Java-Themen 8
D Variablen zur Laufzeit global speichern (Registry Pattern?) Allgemeine Java-Themen 6
Z Design um boolsche ausdrücke zu speichern & auszuwerten Allgemeine Java-Themen 3
M Instanzierte Objekte in XML Dokument speichern Allgemeine Java-Themen 3
S Speichern/Laden/Hinzufügen/Löschen der Array-Wörter; unerwartete Ausgabe Allgemeine Java-Themen 6
M Aus Excel Tabelle lesen und Werte in Array speichern Allgemeine Java-Themen 15
H Eclipse x Stellen einer Zahl in array speichern Allgemeine Java-Themen 3
P Objekt Array in Datei Speichern Allgemeine Java-Themen 3
DStrohma Passwort in Datei speichern - wie? Allgemeine Java-Themen 31
K Input/Output Im Programm instanzierte Objekte Speichern und laden Allgemeine Java-Themen 3
H Objekte Serialisiert speichern Allgemeine Java-Themen 10
K Datei aus.jar extern speichern Allgemeine Java-Themen 10
C JasperReports, PDF und "Speichern unter"-Dialog Allgemeine Java-Themen 7
R Java Array speichern & laden Allgemeine Java-Themen 23
D System.out's in String speichern. Allgemeine Java-Themen 2
C Zugangsdaten halbwegs sicher speichern Allgemeine Java-Themen 46

Ähnliche Java Themen

Neue Themen


Oben