Hashmap auseinandernehmen und analysieren

zenpaticx

Mitglied
Hallo an alle,

ich versuche momentan ein Programm zu schreiben, bei dem eine Textdatei eingelesen wird und dann erkannt werden soll, um welche Sprache es sich handelt.

Kurz der Aufbau: Textdatei wird eingelesen, in einen String gepackt, gefiltert (dass nur ausgewählte Buchstaben und Zahlen in dem String enthalten werden) und dann kommt schon der spannendere Teil. Ich habe eine Hashmap (char und int), der Key ist der Buchstabe und die Value ist der Wert, wie oft der Buchstabe im Text vorkommt. Am Ende wird die Hashmap ausgegeben.
Ausgegeben wird mit der Methode .entrySet().
Eine beispielshafte Ausgabe ist die aktuelle:
Java:
[a=1, d=1, e=2, w=4, g=1, è=1, é=1, ê=1]

Jetzt stehe ich vor dem folgenden Problem und weiß auch ehrlich gesagt nicht wie ich das Problem angehen soll, da das Programm zeitnah fertig sein soll.
Ich probiere zwar gerne aus, habe aber wirklich keine weitere Idee mehr.

Also, was ich jetzt vorhabe: Ich will gucken, z.B. aha a ist 1 mal, w ist 4 mal usw. im Text enthalten.
Ich will anhand der Tabelle von Wikipedia schauen, welche Sprache es ist.

Hat bitte jemand eine Idee?

Besten Dank und einen schönen Abend!
 

Java20134

Bekanntes Mitglied
Nimm dir doch einfach einen Text mit einer bestimmten Anzahl von Wörtern. Lies ihn ein und du erhältst damit die Prozente, da du die Gesamtanzahl kennst und die Anzahl des Buchstabens in dem Text und dann schaust du, welche Sprache passt: Wo es die meisten Übereinstimmungen gibt. Diese Tabelle aus Wikipedia würde ich daher auch in eine externe Datei speichern und auslesen und dann hast du auch da die Daten!
 

zenpaticx

Mitglied
@Java20134 Ja das ist auch das, was ich vorhabe, allerdings wenn ich jetzt eine Datei mit einem Buchstabe habe (a), dann ist a zu 100%. Woher soll man dann wissen, welche Sprache es ist?

Okay mit einem Buchstabe ist das ein dummes Beispiel, aber ich muss ja die prozentualen Werte irgendwie verändern. Der Buchstabe a kommt lt. Wikipedia bei uns zu 6,51 % vor. Aber wie wurde das berechnet? Von allen Wörtern im Duden? Wenn ich jetzt einen deutschsprachigen Text habe, und a kommt zu 25 % vor, woher soll ich wissen, dass der Text deutsch ist?
 

Java20134

Bekanntes Mitglied
Auf was diese Berechnungen basieren kann ich dir nicht sagen! Und genaue Angaben wirst du mit der Tabelle nicht hinbekommen, da die Prozentangaben einen Durchschnitt angeben. Aber nicht jeder Text entspricht dem Durchschnitt!
 

Meniskusschaden

Top Contributor
allerdings wenn ich jetzt eine Datei mit einem Buchstabe habe (a), dann ist a zu 100%. Woher soll man dann wissen, welche Sprache es ist?
Na ja, ein Text der zu 100% aus dem Buchstaben a besteht, ist ja in so ziemlich allen Sprachen gleich aussagekräftig, also quasi ein multilingualer Text. Da muss man wohl keine Sprache zuordnen.;)
Wenn ich jetzt einen deutschsprachigen Text habe, und a kommt zu 25 % vor, woher soll ich wissen, dass der Text deutsch ist?
Einen Text mit einem 25-prozentigen a-Anteil wirst du vermutlich auch kaum finden. Nach deinem Ansatz und den im Wikipedia-Artikel vertretenen Sprachen, würde das eben für Spanisch sprechen. Mir ist im Moment der Zweck deines Postings nicht klar. Zweifelst du jetzt prinzipiell am Erfolg deines Ansatzes und suchst nach Alternativen oder benötigst du noch Unterstützung, deinen Ansatz umzusetzen? Dann solltest du vielleicht eine konkretere Frage stellen.
Ich glaube du solltest erstmal Prozentrechnung lernen bevor du weiter machst. Das ist nun wirklich mathematisch kein Kunstwerk was du da vorhast
Das ist natürlich eine Voraussetzung. Allerdings ist er ja noch nicht fertig, wenn er die prozentualen Werte für den untersuchten Text hat, denn er muss sich ja noch eine Berechnungsmethode überlegen, um festzustellen, welche der ca. zehn bei Wikipedia aufgelisteten Verteilungen am besten dazu passt. Das geht ja schon etwas über Prozentrechnung hinaus.
 

Thallius

Top Contributor
Das ist natürlich eine Voraussetzung. Allerdings ist er ja noch nicht fertig, wenn er die prozentualen Werte für den untersuchten Text hat, denn er muss sich ja noch eine Berechnungsmethode überlegen, um festzustellen, welche der ca. zehn bei Wikipedia aufgelisteten Verteilungen am besten dazu passt. Das geht ja schon etwas über Prozentrechnung hinaus.

Nein, da errechnet er einfach die prozentuale Gesammtabweichung zu jeder Sprache und nimmt das Minimum. Ist auch nur Prozentrechnung
 

Meniskusschaden

Top Contributor
Und die prozentuale Gesamtabweichung ist was? Die Summe der Absolutwerte der Differenzen zwischen den prozentualen Anteilen pro Buchstabe? Ja, das könnte funktionieren. Ich hatte eigentlich irgendeine wilde Korrelations-Chi²-Sonstwas-Koeffizienten-Formel erwartet. Aber in der Statistik kommt's ja oft anders, als man denkt.;)
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
S HashMap mehrere Keys zu einem Value Java Basics - Anfänger-Themen 3
A Daten aus einer HashMap aus einer DB speichern und mit neuen Werten vergleichen Java Basics - Anfänger-Themen 8
T HashMap Lsite gibt die sachen nicht aus wie gewollt. Java Basics - Anfänger-Themen 3
krgewb HashMap Java Basics - Anfänger-Themen 2
B Hashmap richtig bauen, die Tripel auf Zahl abbildet? Java Basics - Anfänger-Themen 10
"java.util.HashMap.get(Object)" is null Java Basics - Anfänger-Themen 10
berserkerdq2 Hashmap, wie prüfe ich ob ein Key schon existiert Java Basics - Anfänger-Themen 19
S Durch HashMap iterieren Java Basics - Anfänger-Themen 8
rafi072001 Sortieren einer HashMap nach Values Java Basics - Anfänger-Themen 2
F gson mit einer Hashmap Java Basics - Anfänger-Themen 2
J JSON-HashMap Java Basics - Anfänger-Themen 3
J Hashmap Java Basics - Anfänger-Themen 13
C Hashmap zickt Java Basics - Anfänger-Themen 9
S HashMap contains() Methode Java Basics - Anfänger-Themen 1
Z Satz aufteilen und die Wörter zählen (HashMap) Java Basics - Anfänger-Themen 15
N enum Attribut von Objekten einer Hashmap ausgeben Java Basics - Anfänger-Themen 6
P Verschachtelte Hashmap Java Basics - Anfänger-Themen 6
I Sortiert eine HashMap nicht gleich wie eine ArrayList? Java Basics - Anfänger-Themen 1
B HashMap alphabetisch sortieren Java Basics - Anfänger-Themen 2
J HashMap Java Basics - Anfänger-Themen 6
M Enum-Variable HashMap zuweisen Java Basics - Anfänger-Themen 5
U Hashmap Iterator selbst implementieren Java Basics - Anfänger-Themen 10
N HashMap in List good practice? Java Basics - Anfänger-Themen 2
K Value eines HashMaps in einer HashMap wiedergeben. Java Basics - Anfänger-Themen 5
O Hashmap, ArrayList, LinkedList Java Basics - Anfänger-Themen 7
O HashMap - ArrayList Java Basics - Anfänger-Themen 29
J Hashmap langsamer als compareTo? Java Basics - Anfänger-Themen 23
E HashMap+Vererbung Java Basics - Anfänger-Themen 11
J Erhöhen eines Values als Integer bei gleichen Keys in HashMap Java Basics - Anfänger-Themen 12
N Methoden HashMap interne Werte miteinander vergleichen Java Basics - Anfänger-Themen 7
W The type Long is not visible HashMap Java Basics - Anfänger-Themen 4
M Objekt mit Hashmap vergleichen Java Basics - Anfänger-Themen 22
S Gibt es für die Klasse HashMap Generic Implementierungen? Java Basics - Anfänger-Themen 11
C HashMap - alle keys haben values der letzten put-Anweisung Java Basics - Anfänger-Themen 3
J Hashmap auslesen Java Basics - Anfänger-Themen 7
F HashMap sortieren <String, Long> Java Basics - Anfänger-Themen 3
GreenTeaYT HashMap dupliziert meine Elemente? Java Basics - Anfänger-Themen 2
shiroX Methoden Morse-Code Übersetzer mit HashMap Java Basics - Anfänger-Themen 5
E HashMap Problem Java Basics - Anfänger-Themen 5
P Hashmap anstatt LinkedList? Java Basics - Anfänger-Themen 6
T HashMap und die Methoden Java Basics - Anfänger-Themen 13
N Methoden Interaktives PDF mit HashMap befüllen Java Basics - Anfänger-Themen 0
B Durchlaufen von Hashmap und Arraylist Java Basics - Anfänger-Themen 8
F HashMap oder welches Array? Java Basics - Anfänger-Themen 4
T HashMap Java Basics - Anfänger-Themen 24
L Hashmap mit variablem Key Java Basics - Anfänger-Themen 9
M Collections Probleme mit Hashmap Java Basics - Anfänger-Themen 4
N Collections String in HashMap umwandeln Java Basics - Anfänger-Themen 3
Z HashMap richtig benutzen Java Basics - Anfänger-Themen 2
lgund HashMap // TS3 Query Java Basics - Anfänger-Themen 7
Z Hashmap Iterator löscht nicht Java Basics - Anfänger-Themen 8
E Hashmap Wert auslesen Java Basics - Anfänger-Themen 2
S Printstream für einen Hashmap Loop Java Basics - Anfänger-Themen 1
dat_vin OOP Hashmap und Attribute Java Basics - Anfänger-Themen 7
C Check ob eine HashMap schon existiert Java Basics - Anfänger-Themen 16
P Vererbung Eigene HashMap Variante Java Basics - Anfänger-Themen 2
R Hashmap in anderer Klasse nicht benutzbar Java Basics - Anfänger-Themen 1
T Java Hashmap Java Basics - Anfänger-Themen 3
L Gibt es etwas wie "HashMap <String, String, String> Java Basics - Anfänger-Themen 9
K HashMap mit Daten aus ArrayList befüllen Java Basics - Anfänger-Themen 14
S OOP Klasse mit static-Eigenschaften - HashMap füllen Java Basics - Anfänger-Themen 6
O HashMap Fragen Java Basics - Anfänger-Themen 8
T HashMap Werte einfügen, durchsuchen und auslesen Java Basics - Anfänger-Themen 17
M Semantisches Problem HashMap/Netzwerk Java Basics - Anfänger-Themen 4
D HashMap Keys durchlaufen Java Basics - Anfänger-Themen 2
B Zugriff auf csv-Datei per hashmap Java Basics - Anfänger-Themen 5
M HashMap keys ausgeben Java Basics - Anfänger-Themen 2
S In einer Hashmap Klassen regestrieren Java Basics - Anfänger-Themen 2
H Collections Was ist schneller - HashMap + Sort v TreeMap? Java Basics - Anfänger-Themen 75
F HashMap nach kleinstem Value durchsuchen Java Basics - Anfänger-Themen 11
G HashMap Java Basics - Anfänger-Themen 6
F Wortpaare - HashMap - ArrayList Java Basics - Anfänger-Themen 6
M HashMap Frage Java Basics - Anfänger-Themen 3
M HashMap - put() reagiert nicht? Java Basics - Anfänger-Themen 8
N Cast eines Objektes in eine Hashmap Java Basics - Anfänger-Themen 13
A CSV Zeilenweise einlesen und in einer HashMap speichern Java Basics - Anfänger-Themen 12
A Input/Output Hashmap in einem JPanel via JList anzeigen Java Basics - Anfänger-Themen 8
K HashMap auf leere Key-Value-Paare prüfen Java Basics - Anfänger-Themen 14
F Hilfe bei der HashMap. Java Basics - Anfänger-Themen 3
F HashMap vs. TreeMap Java Basics - Anfänger-Themen 5
B HashMap Java Basics - Anfänger-Themen 9
C Collections String[] als value in HashMap Java Basics - Anfänger-Themen 6
V Hashmap Iterieren Java Basics - Anfänger-Themen 4
C Csv File in Hashmap ausgeben Java Basics - Anfänger-Themen 14
T HashMap<String,Object> Werte auslesen Java Basics - Anfänger-Themen 5
I HashMap sortieren Java Basics - Anfänger-Themen 10
I HashMap Java Basics - Anfänger-Themen 11
H Collections Brauche modifizierte HashMap Java Basics - Anfänger-Themen 6
H TreeMap/HashMap synchronisieren Java Basics - Anfänger-Themen 2
A Datentypen Hashmap to Array Java Basics - Anfänger-Themen 11
D HashMap überschreibt Werte Java Basics - Anfänger-Themen 7
pg1337 Interface Comparable-Interface bei HashMap Java Basics - Anfänger-Themen 21
D erweiterte hashmap Java Basics - Anfänger-Themen 5
H HashMap<Int, String> - Er findet die Int-Klasse nicht. Java Basics - Anfänger-Themen 3
L HashMap zu JList Java Basics - Anfänger-Themen 6
S Erste Schritte HashMap Kurze Frage - Werte über Schleife ausgeben Java Basics - Anfänger-Themen 30
F Collections ArrayList oder Hashmap mittel Collections.sychronised Java Basics - Anfänger-Themen 6
B Klassen HashMap Zwei Objekte, gleicher Key Java Basics - Anfänger-Themen 4
N HashMap fehlerhafte Rückgabe Java Basics - Anfänger-Themen 7
K Durch eine HashMap wandern? Java Basics - Anfänger-Themen 2

Ähnliche Java Themen

Neue Themen


Oben