Datentypen Erstellung eines Containers, der verschachtelte Map-Strukturen beherbergen kann

orgq3masch · 17. Mrz 2016

Wie schon im Titel beschrieben brauche ich einen Container, der in der Lage ist eine bestimmte Datenstruktur zu speichern und vernünftig ansprechbar zu machen:

Mein derzeitiger Ansatz ist der folgende:

Java:

private void processDatabase(String databaseString) throws IOException {
       
        String[] documentLines = databaseString.split("\\n");
        int N = documentLines.length; // N int
        String[] completeFilteredText = pk.filterStopwords(databaseString);
        completeKeywords = pk.countKeywords(completeFilteredText);
        completeKeywords.forEach((String key, Integer value) -> { // n HashMap<String, Integer>
            int n = 0;
            for (String line : documentLines) {
                if (line.contains(String.valueOf(key))){
                    n++;
                }
                nKeywords.put(key, n);
            }
        });
        infoJLabel.setText(completeKeywords.getOrDefault("INFO", 0).toString());
        warnJLabel.setText(completeKeywords.getOrDefault("WARN", 0).toString());
        errorJLabel.setText(completeKeywords.getOrDefault("ERROR", 0).toString());
        debugJLabel.setText(completeKeywords.getOrDefault("DEBUG", 0).toString());
       
        for (String documentLine : documentLines) {
            documentLine = documentLine.replace("\n", " ");
            sortedKeywords.clear();
            //System.out.println("line: " + line);
            String[] lineWords = documentLine.split(" ");
            String[] documentFilteredText = pk.filterStopwords(documentLine);
            keywords = pk.countKeywords(documentFilteredText);
            sortedKeywords = rr.rankKeywords(keywords, lineWords[0], N, nKeywords);
            keywordsPerDocument.put(lineWords[0], sortedKeywords);
        }
        keywordsPerDocument.forEach((String key, TreeSet<Entry<String, Double>> value) -> {
            System.out.println("Key: " + key);
            TreeSet<Entry<String, Double>> treeSet = keywordsPerDocument.get(key);
            Iterator it = treeSet.iterator();
            while (it.hasNext()) {
                System.out.println("Keyword: " + it.next().toString());
            }
        });
    }

Hier sind die dazugehörigen relevanten aufgerufenen Methoden:

Java:

public class ProcessKeywords {
    public String[] filterStopwords(String text) throws IOException {
        Pattern p1 = Pattern.compile( "[\\d*\\p{Punct}*]*" );
        Pattern p2 = Pattern.compile( "\\d*" );
        Pattern p3 = Pattern.compile( "\\p{Punct}*" );
        //System.out.println(text);
        text = text.replace("\\p{Punct}", " ");
       
        String[] split = StringUtils.split(text, " ");
        String filteredTextString = new String();
        for (String s : split) {
            s = s.trim();
            Matcher m1 = p1.matcher(s);
            Matcher m2 = p2.matcher(s);
            Matcher m3 = p3.matcher(s);
            if ( !m1.matches() && !m2.matches() && !m3.matches() && (s!=null) && (!s.equals(""))){

                filteredTextString = filteredTextString + " " + s;
            }
        }
        String[] filteredText = StringUtils.split(filteredTextString, " ");
        return filteredText;
    }

    private HashMap<String, Integer> keywords = new HashMap<>();
    public HashMap<String, Integer> countKeywords(String[] filteredText) {
        for (String entry : filteredText) {
            keywords.putIfAbsent(entry, 1);
            if (keywords.containsKey(entry)) {
                keywords.replace(entry, keywords.getOrDefault(entry, 0), keywords.getOrDefault(entry, 0) + 1);
            }
        }
        return keywords;
    }

und

Code:

public class RelevanceRanking {

    private int terms;// Anzahl der Terme im Dokument
    private double G;
    private final WDFIDF wd = new WDFIDF();
    private Map<String, Double> gewichtung;
    private TreeSet<Map.Entry<String, Double>> sortedGewichtung = new TreeSet();
   
    public TreeSet<Map.Entry<String, Double>> rankKeywords(HashMap<String, Integer> keywords, String text, int N, HashMap<String, Integer> nKeywords) throws IOException {
        this.gewichtung = new TreeMap();
        String[] split = text.split(" ");
        for (String entry : split) {
            entry = entry.trim();
            keywords.putIfAbsent(entry, 1);
            if (keywords.containsKey(entry)) {
                keywords.replace(entry, keywords.get(entry), keywords.get(entry) + 1);
            }
        }
        terms = split.length;
        keywords.forEach((Object key, Object value) -> {
            try {
                //System.out.println(String.valueOf("Keyword zum gewichten: " + key));
                G = wd.wdfidf(value.toString(), String.valueOf(terms), String.valueOf(N), String.valueOf(nKeywords.getOrDefault(key, 1)));
                gewichtung.put((String) key, G);
            } catch (IOException ex) {
                Logger.getLogger(ProcessKeywords.class.getName()).log(Level.SEVERE, null, ex);
            }
        });
        sortedGewichtung = entriesSortedByValues(gewichtung);
        return sortedGewichtung;
    }
   
    static <K,V extends Comparable<? super V>>
    TreeSet<Map.Entry<K,V>> entriesSortedByValues(Map<K,V> map) {
        TreeSet<Map.Entry<K,V>> sortedEntries = new TreeSet<>(
            (Map.Entry<K,V> e1, Map.Entry<K,V> e2) -> {
                int res = e2.getValue().compareTo(e1.getValue());
                return res != 0 ? res : 1;
        });
        sortedEntries.addAll(map.entrySet());
        return sortedEntries;
    }
}

Wobei die Methode WDFIDF ausschließlich Berechnungen durchführt und nicht relevant ist.

Um das ganze in einem Zusammenhang zu setzen: Man nehme einen Text, importiere diesen in einen String, splitte diesen String in einen StringArray mit jeder einzelnen Zeile drin.
Jede dieser Zeilen muss nun verarbeitet werden, dazu wird sie wiederum in einen StringArray mit allen beinhaltenden Wörtern gesplittet und analysiert.
Nun kommen wir zu meinem problem: Einerseits muss ich für jede Zeile eine HashMap mit allem vorkommenden Worten anlegen (umgeformt in einen TreeSet um das ganze nicht nur nach key, sondern auch nach value sortieren zu können), und andererseits muss ich eine Übersicht über den so entstehenden Korpus erhalten, wiederum eine HashMap, die ein TreeSet als value hat.
<String s, TreeSet<String s, Double d>>

Wie man im Code bereits sieht -->

Java:

keywordsPerDocument.forEach((String key, TreeSet<Entry<String, Double>> value) -> {
            System.out.println("Key: " + key);
            TreeSet<Entry<String, Double>> treeSet = keywordsPerDocument.get(key);
            Iterator it = treeSet.iterator();
            while (it.hasNext()) {
                System.out.println("Keyword: " + it.next().toString());
            }
        });

versuche ich die so erstellten Daten irgendwie anzusprechen, und wie einen verschachtelten Array ausgeben zu lassen (was natürlich nicht dasselbe ist und anders implementiert wird). Dabei ist es meine Absicht für jede Zeile einen Korpus mit den einzelnen Wörtern und ihrer Gewichtung zu erhalten.
Was ich bekomme ist ein Gewurschtel aus Zeilen-Ausgaben, gefolgt von den Wort-Gewichtungs-Paaren, aber keine ordentliche Struktur, was das weiterverarbeiten der Daten unmöglich mach, geschweige denn das verstehen logischer Fehler meiner Implementation.

Nun stellt sich mir die Frage, ob ich diese Aufgabe mit den richtigen Mitteln angehe, oder es sinnvoller wäre ein selbst erstelltes Objekt zu formen und dieses in einer geeigneteren Datenstruktur abzuspeichern (falls dies möglich ist).

	Titel	Forum	Antworten	Datum
H	Hilfe bei Erstellung eines Hilfe Fenster bei Tastendruck (F1 bei Win98)	Allgemeine Java-Themen	5	31. Jan 2017
D	Frage bzgl. Erstellung eines Datenmodells	Allgemeine Java-Themen	5	12. Aug 2011
G	Brauche Hilfe bei Erstellung eines Musters!	Allgemeine Java-Themen	3	11. Feb 2005
	PDF Erstellung / Reports Framework	Allgemeine Java-Themen	3	16. Apr 2022
	Erstellung von Testdaten für Arrays	Allgemeine Java-Themen	6	8. Mai 2021
D	UML Erstellung	Allgemeine Java-Themen	6	19. Nov 2020
A	Vererbung Übungsaufgabe Vererbung - Erstellung Klassenhierarchie	Allgemeine Java-Themen	1	9. Mrz 2015
	Programmatische Java Projekt Erstellung	Allgemeine Java-Themen	2	10. Jul 2012
C	Umlautdarstellung nach Jar-Erstellung	Allgemeine Java-Themen	4	10. Apr 2012
A	Salt Erstellung verbessern	Allgemeine Java-Themen	7	28. Jun 2011
M	GUI - Erstellung	Allgemeine Java-Themen	21	21. Mai 2011
S	Erstellung einer verschlüsselten Passwort Datei	Allgemeine Java-Themen	11	24. Feb 2011
	Unterschied bei Thread Erstellung	Allgemeine Java-Themen	11	21. Sep 2010
J	Progress Bar während Datenbank Erstellung	Allgemeine Java-Themen	2	21. Aug 2010
A	Dynamische PDF Erstellung mit iText	Allgemeine Java-Themen	4	2. Aug 2009
G	Problem bei jar erstellung	Allgemeine Java-Themen	4	16. Sep 2008
D	erstellung einer seitenlangen xml durch ireport	Allgemeine Java-Themen	3	21. Apr 2008
A	Problem mit der jar-Erstellung	Allgemeine Java-Themen	5	11. Jan 2008
@	[RegExp] Probleme bei Erstellung des Ausdrucks	Allgemeine Java-Themen	3	20. Nov 2007
C	ApplicationContext blockiert bei der Erstellung	Allgemeine Java-Themen	2	10. Sep 2007
A	Thema JAR-Erstellung (mal wieder) => etwas komplizierter	Allgemeine Java-Themen	8	22. Jan 2007
S	PDF Erstellung mit zusätzlichen Headerinformationen	Allgemeine Java-Themen	2	6. Jul 2006
G	Object erstellung und initialisierung.	Allgemeine Java-Themen	4	7. Sep 2005
G	Objekt Erstellung in run() von Threads/Runnables	Allgemeine Java-Themen	3	8. Apr 2005
O	regulärer Ausdruck zum durchsuchen eines Strings verwenden	Allgemeine Java-Themen	2	4. Okt 2023
T	Rotationswinkel eines Bildes bestimmen	Allgemeine Java-Themen	4	31. Aug 2023
C	Probleme beim Erstellen eines runnable-jar files	Allgemeine Java-Themen	1	22. Feb 2023
J	JavaScript innerhalb eines Java Projekts ausführen	Allgemeine Java-Themen	2	26. Jan 2023
	Größe eines Objektes in Byte berechnen	Allgemeine Java-Themen	2	19. Nov 2022
	Prüfen ob min. ein Element eines Sets in einem anderen Set enh	Allgemeine Java-Themen	4	8. Nov 2022
M	Array Rang eines Elements	Allgemeine Java-Themen	4	3. Nov 2022
	Teile eines Links entfernen	Allgemeine Java-Themen	6	19. Sep 2022
H	Auslesen eines (LDAP-)Attributs in Active Directory	Allgemeine Java-Themen	2	9. Jun 2022
W	JSON parsen eines ,mit JS.stringify erstellten Strings	Allgemeine Java-Themen	27	7. Jun 2022
H	Textposition eines gedrehten Textes verschieben	Allgemeine Java-Themen	8	29. Mai 2022
	run-methode eines Threads so programmieren, dass 30x die Sekunde etwas ausgeführt wird.	Allgemeine Java-Themen	44	30. Apr 2022
E	Ersetzen eines Bildes in der Kopfzeile eines Word-Docx-Dokuments mit Apache POI XWPF	Allgemeine Java-Themen	0	1. Apr 2022
N	Fahrtrichtung eines selbstfahrenden Auto ändern	Allgemeine Java-Themen	3	19. Jan 2022
T	Letztes Zeichen eines Strings enfernen	Allgemeine Java-Themen	14	21. Okt 2021
S	Übergabe eines Sortierkriteriums für ein Artikel Array mittels BiPredicate<Artikel, Artikel>	Allgemeine Java-Themen	13	17. Jun 2021
	Schatzsuche mithilfe eines O(log n) Algorithmus	Allgemeine Java-Themen	2	15. Mai 2021
C	Koordinaten LONG/LAT eines neuen Punktes in bestimmter Entfernen und Winkel berechnen	Allgemeine Java-Themen	3	29. Apr 2021
	Meine Funktion für das beinhalten eines Punktes in einem Kreis funktioniert nicht	Allgemeine Java-Themen	5	6. Mrz 2021
	Direktes return eines Array geht nicht	Allgemeine Java-Themen	20	13. Okt 2020
S	Mittelwert anhand eines Stream berechnen	Allgemeine Java-Themen	5	26. Sep 2020
	Breite eines erweiterten Monitors feststellen	Allgemeine Java-Themen	5	31. Jul 2020
R	Zeilen eines 2d Arrays abwechselnd links und rechts mit Nullen auffüllen	Allgemeine Java-Themen	14	26. Mai 2020
	Alternative Darstellung eines Codesnippets	Allgemeine Java-Themen	33	24. Mai 2020
	Inhalt eines Arrays ändert sich mysteriös	Allgemeine Java-Themen	2	6. Mai 2020
	Wget mit Wildcards - oder wie lädt man bei JFrog die letzte Version eines Artifacts herunter	Allgemeine Java-Themen	3	28. Apr 2020
N	Erkennen eines Programs	Allgemeine Java-Themen	2	25. Apr 2020
N	Pausieren eines Programmes	Allgemeine Java-Themen	4	14. Apr 2020
D	Input/Output Implementierung eines CommandHandlers/Parsers für viele Eingaben	Allgemeine Java-Themen	26	12. Feb 2020
M	Gibt es eine API die den aktuellen Wert eines Indikators beim Trading zurückgibt?	Allgemeine Java-Themen	7	21. Dez 2019
F	Wie bekommt man alle Filenamen eines Webserver Verzeichnisses	Allgemeine Java-Themen	6	20. Dez 2019
A	Fehler beim Öffnen eines Projekts	Allgemeine Java-Themen	6	4. Nov 2019
N	Eigenschaften eines Buttons per Setter verändern	Allgemeine Java-Themen	5	28. Sep 2019
S	Ausfuehrung eines Programms aufzeichnen..?	Allgemeine Java-Themen	4	27. Sep 2019
X	Ermittlung eines doppelte Paars mit Streams	Allgemeine Java-Themen	50	1. Sep 2019
	Prüfen von direkter Implementierung eines Interfaces	Allgemeine Java-Themen	7	24. Jul 2019
S	Vorbereitung eines Praktikums	Allgemeine Java-Themen	4	15. Jan 2019
H	Aufruf eines Web Service anhand übergebenen Parameter	Allgemeine Java-Themen	2	11. Jan 2019
M	Weiterleiten von empfangenen Nachrichten eines StompSessionHandlers	Allgemeine Java-Themen	1	7. Sep 2018
J	Programm zum Suchen eines Wortes im Dateisystem	Allgemeine Java-Themen	4	26. Aug 2018
H	Rename eines Projekts	Allgemeine Java-Themen	1	14. Jul 2018
J	Fenstergröße eines anderen Programmes auslesen	Allgemeine Java-Themen	9	6. Jul 2018
	auf Klassen innerhalb eines package zugreifen	Allgemeine Java-Themen	22	24. Apr 2018
	Erste Schritte Sourcetree - Git \| Suchen eines Commits	Allgemeine Java-Themen	2	28. Feb 2018
E	Status eines USB Mikrofon abfragen	Allgemeine Java-Themen	2	7. Jan 2018
	OOP Ansätze und Tipps zum Porgrammieren eines Taschenrechners	Allgemeine Java-Themen	25	8. Dez 2017
A	OOP Problem beim Berechnen der größten Fläche eines Ringes	Allgemeine Java-Themen	19	20. Nov 2017
	Start eines Anderen Programm erkennen	Allgemeine Java-Themen	6	4. Okt 2017
I	Verbindung eines Java-Plugins mit Webserver	Allgemeine Java-Themen	3	1. Aug 2017
L	Auswertung eines Testes funktioniert nicht	Allgemeine Java-Themen	37	29. Jun 2017
G	Iteratoren - Wie kann man mithilfe von Iteratoren nur jeden zweiten Wert eines TreeSets ausgeben?	Allgemeine Java-Themen	4	10. Jun 2017
	Elemente eines 2Dim LinkedList von links nach rechts ausgeben?	Allgemeine Java-Themen	0	4. Jun 2017
B	Spalten eines 2d-Arrays	Allgemeine Java-Themen	2	22. Mai 2017
M	Rechenprogramm eines wissenschaftlichen Taschenrechners	Allgemeine Java-Themen	4	15. Mrz 2017
S	Eigenschaften (hier Verknüpfung) eines Files lesen	Allgemeine Java-Themen	2	24. Feb 2017
E	Typüberprüfung eines chars	Allgemeine Java-Themen	5	18. Feb 2017
T	Teile eines Double-Wertes verändern	Allgemeine Java-Themen	2	28. Dez 2016
R	Rückgabe eines Arrays durch Funktion	Allgemeine Java-Themen	9	27. Aug 2016
H	Datentypen Typ eines Arrays überprüfen	Allgemeine Java-Themen	9	8. Aug 2016
	DPI eines Bildes ändern	Allgemeine Java-Themen	4	2. Jun 2016
N	Methoden Methoden einer Klasse auf Grundlage eines Strings aufrufen	Allgemeine Java-Themen	6	24. Mai 2016
K	Bestimmten Bereich eines Strings lesen	Allgemeine Java-Themen	6	20. Mai 2016
C	-Verschiedene Versionen eines Programms verwalten	Allgemeine Java-Themen	7	4. Apr 2016
A	einmalige Ausführung eines Methodenabschnittes	Allgemeine Java-Themen	3	22. Feb 2016
F	CPU Last eines Thread ausfindig machen	Allgemeine Java-Themen	0	21. Feb 2016
L	Menge der Buchstaben eines Textes zählen	Allgemeine Java-Themen	3	22. Nov 2015
F	Teil eines Bildes laden	Allgemeine Java-Themen	1	12. Nov 2015
	Operatoren regEx für das Erstellen eines Strings verwenden	Allgemeine Java-Themen	3	28. Okt 2015
P	Löschen eines keys in einer SortedMap	Allgemeine Java-Themen	5	20. Okt 2015
	Input/Output URL eines Zip Entry?	Allgemeine Java-Themen	2	28. Aug 2015
S	Alle Methodenaufrufe eines Threads notieren..?	Allgemeine Java-Themen	7	27. Aug 2015
J	NullPointerExeption bei Inizialisierung eines Arrays	Allgemeine Java-Themen	3	1. Aug 2015
I	Setzen und Lesen eines Objektes (Enum?)	Allgemeine Java-Themen	10	17. Jul 2015
L	Implementierung eines AVT-Baums	Allgemeine Java-Themen	2	1. Jul 2015
D	Größe der Zahlenkombinationen eines Arrays begrenzen	Allgemeine Java-Themen	3	16. Jun 2015
D	Objekt entlang eines Funktionsgraphens bewegen	Allgemeine Java-Themen	6	1. Apr 2015

Datentypen Erstellung eines Containers, der verschachtelte Map-Strukturen beherbergen kann

orgq3masch

Mitglied

Ähnliche Java Themen

Aktuelle Jobs

Neue Themen