Hashmap auseinandernehmen und analysieren

zenpaticx · 16. Mai 2016

Hallo an alle,

ich versuche momentan ein Programm zu schreiben, bei dem eine Textdatei eingelesen wird und dann erkannt werden soll, um welche Sprache es sich handelt.

Kurz der Aufbau: Textdatei wird eingelesen, in einen String gepackt, gefiltert (dass nur ausgewählte Buchstaben und Zahlen in dem String enthalten werden) und dann kommt schon der spannendere Teil. Ich habe eine Hashmap (char und int), der Key ist der Buchstabe und die Value ist der Wert, wie oft der Buchstabe im Text vorkommt. Am Ende wird die Hashmap ausgegeben.
Ausgegeben wird mit der Methode .entrySet().
Eine beispielshafte Ausgabe ist die aktuelle:

Java:

[a=1, d=1, e=2, w=4, g=1, è=1, é=1, ê=1]

Jetzt stehe ich vor dem folgenden Problem und weiß auch ehrlich gesagt nicht wie ich das Problem angehen soll, da das Programm zeitnah fertig sein soll.
Ich probiere zwar gerne aus, habe aber wirklich keine weitere Idee mehr.

Also, was ich jetzt vorhabe: Ich will gucken, z.B. aha a ist 1 mal, w ist 4 mal usw. im Text enthalten.
Ich will anhand der Tabelle von Wikipedia schauen, welche Sprache es ist.

Hat bitte jemand eine Idee?

Besten Dank und einen schönen Abend!

Java20134 · 16. Mai 2016

Nimm dir doch einfach einen Text mit einer bestimmten Anzahl von Wörtern. Lies ihn ein und du erhältst damit die Prozente, da du die Gesamtanzahl kennst und die Anzahl des Buchstabens in dem Text und dann schaust du, welche Sprache passt: Wo es die meisten Übereinstimmungen gibt. Diese Tabelle aus Wikipedia würde ich daher auch in eine externe Datei speichern und auslesen und dann hast du auch da die Daten!

zenpaticx · 16. Mai 2016

@Java20134 Ja das ist auch das, was ich vorhabe, allerdings wenn ich jetzt eine Datei mit einem Buchstabe habe (a), dann ist a zu 100%. Woher soll man dann wissen, welche Sprache es ist?

Okay mit einem Buchstabe ist das ein dummes Beispiel, aber ich muss ja die prozentualen Werte irgendwie verändern. Der Buchstabe a kommt lt. Wikipedia bei uns zu 6,51 % vor. Aber wie wurde das berechnet? Von allen Wörtern im Duden? Wenn ich jetzt einen deutschsprachigen Text habe, und a kommt zu 25 % vor, woher soll ich wissen, dass der Text deutsch ist?

Java20134 · 16. Mai 2016

Auf was diese Berechnungen basieren kann ich dir nicht sagen! Und genaue Angaben wirst du mit der Tabelle nicht hinbekommen, da die Prozentangaben einen Durchschnitt angeben. Aber nicht jeder Text entspricht dem Durchschnitt!

Thallius · 16. Mai 2016

Ich glaube du solltest erstmal Prozentrechnung lernen bevor du weiter machst. Das ist nun wirklich mathematisch kein Kunstwerk was du da vorhast

Meniskusschaden · 16. Mai 2016

zenpaticx hat gesagt.:
allerdings wenn ich jetzt eine Datei mit einem Buchstabe habe (a), dann ist a zu 100%. Woher soll man dann wissen, welche Sprache es ist?

Na ja, ein Text der zu 100% aus dem Buchstaben a besteht, ist ja in so ziemlich allen Sprachen gleich aussagekräftig, also quasi ein multilingualer Text. Da muss man wohl keine Sprache zuordnen.

zenpaticx hat gesagt.:
Wenn ich jetzt einen deutschsprachigen Text habe, und a kommt zu 25 % vor, woher soll ich wissen, dass der Text deutsch ist?

Einen Text mit einem 25-prozentigen a-Anteil wirst du vermutlich auch kaum finden. Nach deinem Ansatz und den im Wikipedia-Artikel vertretenen Sprachen, würde das eben für Spanisch sprechen. Mir ist im Moment der Zweck deines Postings nicht klar. Zweifelst du jetzt prinzipiell am Erfolg deines Ansatzes und suchst nach Alternativen oder benötigst du noch Unterstützung, deinen Ansatz umzusetzen? Dann solltest du vielleicht eine konkretere Frage stellen.

Thallius hat gesagt.:
Ich glaube du solltest erstmal Prozentrechnung lernen bevor du weiter machst. Das ist nun wirklich mathematisch kein Kunstwerk was du da vorhast

Das ist natürlich eine Voraussetzung. Allerdings ist er ja noch nicht fertig, wenn er die prozentualen Werte für den untersuchten Text hat, denn er muss sich ja noch eine Berechnungsmethode überlegen, um festzustellen, welche der ca. zehn bei Wikipedia aufgelisteten Verteilungen am besten dazu passt. Das geht ja schon etwas über Prozentrechnung hinaus.

Thallius · 17. Mai 2016

Meniskusschaden hat gesagt.:
Das ist natürlich eine Voraussetzung. Allerdings ist er ja noch nicht fertig, wenn er die prozentualen Werte für den untersuchten Text hat, denn er muss sich ja noch eine Berechnungsmethode überlegen, um festzustellen, welche der ca. zehn bei Wikipedia aufgelisteten Verteilungen am besten dazu passt. Das geht ja schon etwas über Prozentrechnung hinaus.

Nein, da errechnet er einfach die prozentuale Gesammtabweichung zu jeder Sprache und nimmt das Minimum. Ist auch nur Prozentrechnung

Meniskusschaden · 17. Mai 2016

Und die prozentuale Gesamtabweichung ist was? Die Summe der Absolutwerte der Differenzen zwischen den prozentualen Anteilen pro Buchstabe? Ja, das könnte funktionieren. Ich hatte eigentlich irgendeine wilde Korrelations-Chi²-Sonstwas-Koeffizienten-Formel erwartet. Aber in der Statistik kommt's ja oft anders, als man denkt.

	Titel	Forum	Antworten	Datum
	remove beim Iterieren einer HashMap	Java Basics - Anfänger-Themen	3	11. Mrz 2025
F	Java Object to Hashmap ?	Java Basics - Anfänger-Themen	6	26. Jun 2024
S	HashMap mehrere Keys zu einem Value	Java Basics - Anfänger-Themen	3	27. Dez 2023
A	Daten aus einer HashMap aus einer DB speichern und mit neuen Werten vergleichen	Java Basics - Anfänger-Themen	8	15. Mrz 2023
T	HashMap Lsite gibt die sachen nicht aus wie gewollt.	Java Basics - Anfänger-Themen	3	19. Feb 2023
	HashMap	Java Basics - Anfänger-Themen	2	4. Feb 2023
B	Hashmap richtig bauen, die Tripel auf Zahl abbildet?	Java Basics - Anfänger-Themen	10	30. Okt 2022
モ	"java.util.HashMap.get(Object)" is null	Java Basics - Anfänger-Themen	10	29. Jul 2022
	Hashmap, wie prüfe ich ob ein Key schon existiert	Java Basics - Anfänger-Themen	19	22. Mrz 2022
S	Durch HashMap iterieren	Java Basics - Anfänger-Themen	8	7. Feb 2022
	Sortieren einer HashMap nach Values	Java Basics - Anfänger-Themen	2	19. Mai 2021
F	gson mit einer Hashmap	Java Basics - Anfänger-Themen	2	24. Feb 2021
J	JSON-HashMap	Java Basics - Anfänger-Themen	3	12. Feb 2021
J	Hashmap	Java Basics - Anfänger-Themen	13	11. Feb 2021
C	Hashmap zickt	Java Basics - Anfänger-Themen	9	1. Jan 2021
S	HashMap contains() Methode	Java Basics - Anfänger-Themen	1	27. Nov 2020
Z	Satz aufteilen und die Wörter zählen (HashMap)	Java Basics - Anfänger-Themen	15	21. Okt 2020
N	enum Attribut von Objekten einer Hashmap ausgeben	Java Basics - Anfänger-Themen	6	21. Jul 2020
P	Verschachtelte Hashmap	Java Basics - Anfänger-Themen	6	11. Jul 2020
I	Sortiert eine HashMap nicht gleich wie eine ArrayList?	Java Basics - Anfänger-Themen	1	26. Mai 2020
B	HashMap alphabetisch sortieren	Java Basics - Anfänger-Themen	2	25. Mai 2020
J	HashMap	Java Basics - Anfänger-Themen	6	15. Mai 2020
M	Enum-Variable HashMap zuweisen	Java Basics - Anfänger-Themen	5	13. Mrz 2020
U	Hashmap Iterator selbst implementieren	Java Basics - Anfänger-Themen	10	7. Dez 2019
N	HashMap in List good practice?	Java Basics - Anfänger-Themen	2	4. Jun 2019
K	Value eines HashMaps in einer HashMap wiedergeben.	Java Basics - Anfänger-Themen	5	1. Apr 2019
O	Hashmap, ArrayList, LinkedList	Java Basics - Anfänger-Themen	7	1. Mrz 2019
O	HashMap - ArrayList	Java Basics - Anfänger-Themen	29	23. Feb 2019
J	Hashmap langsamer als compareTo?	Java Basics - Anfänger-Themen	23	14. Feb 2019
E	HashMap+Vererbung	Java Basics - Anfänger-Themen	11	18. Nov 2018
J	Erhöhen eines Values als Integer bei gleichen Keys in HashMap	Java Basics - Anfänger-Themen	12	14. Okt 2018
N	Methoden HashMap interne Werte miteinander vergleichen	Java Basics - Anfänger-Themen	7	5. Jul 2018
W	The type Long is not visible HashMap	Java Basics - Anfänger-Themen	4	25. Mai 2018
M	Objekt mit Hashmap vergleichen	Java Basics - Anfänger-Themen	22	25. Apr 2018
S	Gibt es für die Klasse HashMap Generic Implementierungen?	Java Basics - Anfänger-Themen	11	3. Feb 2018
C	HashMap - alle keys haben values der letzten put-Anweisung	Java Basics - Anfänger-Themen	3	4. Dez 2017
J	Hashmap auslesen	Java Basics - Anfänger-Themen	7	14. Jul 2017
F	HashMap sortieren <String, Long>	Java Basics - Anfänger-Themen	3	28. Jun 2017
	HashMap dupliziert meine Elemente?	Java Basics - Anfänger-Themen	2	7. Jun 2017
	Methoden Morse-Code Übersetzer mit HashMap	Java Basics - Anfänger-Themen	5	26. Apr 2017
E	HashMap Problem	Java Basics - Anfänger-Themen	5	31. Jul 2016
P	Hashmap anstatt LinkedList?	Java Basics - Anfänger-Themen	6	17. Jul 2016
T	HashMap und die Methoden	Java Basics - Anfänger-Themen	13	28. Jun 2016
N	Methoden Interaktives PDF mit HashMap befüllen	Java Basics - Anfänger-Themen	0	25. Mai 2016
B	Durchlaufen von Hashmap und Arraylist	Java Basics - Anfänger-Themen	8	11. Mai 2016
F	HashMap oder welches Array?	Java Basics - Anfänger-Themen	4	7. Apr 2016
T	HashMap	Java Basics - Anfänger-Themen	24	11. Feb 2016
L	Hashmap mit variablem Key	Java Basics - Anfänger-Themen	9	1. Feb 2016
M	Collections Probleme mit Hashmap	Java Basics - Anfänger-Themen	4	16. Jan 2016
N	Collections String in HashMap umwandeln	Java Basics - Anfänger-Themen	3	18. Okt 2015
Z	HashMap richtig benutzen	Java Basics - Anfänger-Themen	2	16. Okt 2015
	HashMap // TS3 Query	Java Basics - Anfänger-Themen	7	1. Sep 2015
Z	Hashmap Iterator löscht nicht	Java Basics - Anfänger-Themen	8	13. Jul 2015
E	Hashmap Wert auslesen	Java Basics - Anfänger-Themen	2	18. Apr 2015
S	Printstream für einen Hashmap Loop	Java Basics - Anfänger-Themen	1	14. Dez 2014
	OOP Hashmap und Attribute	Java Basics - Anfänger-Themen	7	11. Dez 2014
C	Check ob eine HashMap schon existiert	Java Basics - Anfänger-Themen	16	12. Nov 2014
G	Vererbung Eigene HashMap Variante	Java Basics - Anfänger-Themen	2	11. Sep 2014
R	Hashmap in anderer Klasse nicht benutzbar	Java Basics - Anfänger-Themen	1	3. Aug 2014
T	Java Hashmap	Java Basics - Anfänger-Themen	3	23. Jun 2014
L	Gibt es etwas wie "HashMap <String, String, String>	Java Basics - Anfänger-Themen	9	4. Apr 2014
K	HashMap mit Daten aus ArrayList befüllen	Java Basics - Anfänger-Themen	14	11. Mrz 2014
S	OOP Klasse mit static-Eigenschaften - HashMap füllen	Java Basics - Anfänger-Themen	6	3. Mrz 2014
O	HashMap Fragen	Java Basics - Anfänger-Themen	8	29. Dez 2013
T	HashMap Werte einfügen, durchsuchen und auslesen	Java Basics - Anfänger-Themen	17	26. Dez 2013
M	Semantisches Problem HashMap/Netzwerk	Java Basics - Anfänger-Themen	4	7. Dez 2013
D	HashMap Keys durchlaufen	Java Basics - Anfänger-Themen	2	13. Nov 2013
B	Zugriff auf csv-Datei per hashmap	Java Basics - Anfänger-Themen	5	7. Nov 2013
M	HashMap keys ausgeben	Java Basics - Anfänger-Themen	2	28. Sep 2013
S	In einer Hashmap Klassen regestrieren	Java Basics - Anfänger-Themen	2	6. Sep 2013
H	Collections Was ist schneller - HashMap + Sort v TreeMap?	Java Basics - Anfänger-Themen	75	30. Jan 2013
F	HashMap nach kleinstem Value durchsuchen	Java Basics - Anfänger-Themen	11	29. Jan 2013
G	HashMap	Java Basics - Anfänger-Themen	6	23. Jan 2013
F	Wortpaare - HashMap - ArrayList	Java Basics - Anfänger-Themen	6	9. Jan 2013
M	HashMap Frage	Java Basics - Anfänger-Themen	3	14. Okt 2012
M	HashMap - put() reagiert nicht?	Java Basics - Anfänger-Themen	8	4. Okt 2012
N	Cast eines Objektes in eine Hashmap	Java Basics - Anfänger-Themen	13	11. Sep 2012
A	CSV Zeilenweise einlesen und in einer HashMap speichern	Java Basics - Anfänger-Themen	12	14. Aug 2012
A	Input/Output Hashmap in einem JPanel via JList anzeigen	Java Basics - Anfänger-Themen	8	10. Aug 2012
K	HashMap auf leere Key-Value-Paare prüfen	Java Basics - Anfänger-Themen	14	30. Jul 2012
F	Hilfe bei der HashMap.	Java Basics - Anfänger-Themen	3	12. Jul 2012
F	HashMap vs. TreeMap	Java Basics - Anfänger-Themen	5	9. Jul 2012
B	HashMap	Java Basics - Anfänger-Themen	9	5. Jul 2012
C	Collections String[] als value in HashMap	Java Basics - Anfänger-Themen	6	20. Jun 2012
V	Hashmap Iterieren	Java Basics - Anfänger-Themen	4	20. Jun 2012
C	Csv File in Hashmap ausgeben	Java Basics - Anfänger-Themen	14	15. Jun 2012
T	HashMap<String,Object> Werte auslesen	Java Basics - Anfänger-Themen	5	1. Jun 2012
I	HashMap sortieren	Java Basics - Anfänger-Themen	10	19. Apr 2012
I	HashMap	Java Basics - Anfänger-Themen	11	18. Apr 2012
H	Collections Brauche modifizierte HashMap	Java Basics - Anfänger-Themen	6	17. Apr 2012
H	TreeMap/HashMap synchronisieren	Java Basics - Anfänger-Themen	2	10. Apr 2012
A	Datentypen Hashmap to Array	Java Basics - Anfänger-Themen	11	4. Apr 2012
D	HashMap überschreibt Werte	Java Basics - Anfänger-Themen	7	27. Mrz 2012
	Interface Comparable-Interface bei HashMap	Java Basics - Anfänger-Themen	21	27. Feb 2012
D	erweiterte hashmap	Java Basics - Anfänger-Themen	5	13. Jan 2012
H	HashMap<Int, String> - Er findet die Int-Klasse nicht.	Java Basics - Anfänger-Themen	3	29. Dez 2011
L	HashMap zu JList	Java Basics - Anfänger-Themen	6	29. Dez 2011
S	Erste Schritte HashMap Kurze Frage - Werte über Schleife ausgeben	Java Basics - Anfänger-Themen	30	2. Dez 2011
F	Collections ArrayList oder Hashmap mittel Collections.sychronised	Java Basics - Anfänger-Themen	6	23. Nov 2011
B	Klassen HashMap Zwei Objekte, gleicher Key	Java Basics - Anfänger-Themen	4	16. Okt 2011

Hashmap auseinandernehmen und analysieren

zenpaticx

Mitglied

Java20134

Bekanntes Mitglied

zenpaticx

Mitglied

Java20134

Bekanntes Mitglied

Thallius

Top Contributor

Meniskusschaden

Top Contributor

Thallius

Top Contributor

Meniskusschaden

Top Contributor

Ähnliche Java Themen

Aktuelle Jobs

Neue Themen