Hallo an alle,
ich versuche momentan ein Programm zu schreiben, bei dem eine Textdatei eingelesen wird und dann erkannt werden soll, um welche Sprache es sich handelt.
Kurz der Aufbau: Textdatei wird eingelesen, in einen String gepackt, gefiltert (dass nur ausgewählte Buchstaben und Zahlen in dem String enthalten werden) und dann kommt schon der spannendere Teil. Ich habe eine Hashmap (char und int), der Key ist der Buchstabe und die Value ist der Wert, wie oft der Buchstabe im Text vorkommt. Am Ende wird die Hashmap ausgegeben.
Ausgegeben wird mit der Methode .entrySet().
Eine beispielshafte Ausgabe ist die aktuelle:
Jetzt stehe ich vor dem folgenden Problem und weiß auch ehrlich gesagt nicht wie ich das Problem angehen soll, da das Programm zeitnah fertig sein soll.
Ich probiere zwar gerne aus, habe aber wirklich keine weitere Idee mehr.
Also, was ich jetzt vorhabe: Ich will gucken, z.B. aha a ist 1 mal, w ist 4 mal usw. im Text enthalten.
Ich will anhand der Tabelle von Wikipedia schauen, welche Sprache es ist.
Hat bitte jemand eine Idee?
Besten Dank und einen schönen Abend!
ich versuche momentan ein Programm zu schreiben, bei dem eine Textdatei eingelesen wird und dann erkannt werden soll, um welche Sprache es sich handelt.
Kurz der Aufbau: Textdatei wird eingelesen, in einen String gepackt, gefiltert (dass nur ausgewählte Buchstaben und Zahlen in dem String enthalten werden) und dann kommt schon der spannendere Teil. Ich habe eine Hashmap (char und int), der Key ist der Buchstabe und die Value ist der Wert, wie oft der Buchstabe im Text vorkommt. Am Ende wird die Hashmap ausgegeben.
Ausgegeben wird mit der Methode .entrySet().
Eine beispielshafte Ausgabe ist die aktuelle:
Java:
[a=1, d=1, e=2, w=4, g=1, è=1, é=1, ê=1]
Jetzt stehe ich vor dem folgenden Problem und weiß auch ehrlich gesagt nicht wie ich das Problem angehen soll, da das Programm zeitnah fertig sein soll.
Ich probiere zwar gerne aus, habe aber wirklich keine weitere Idee mehr.
Also, was ich jetzt vorhabe: Ich will gucken, z.B. aha a ist 1 mal, w ist 4 mal usw. im Text enthalten.
Ich will anhand der Tabelle von Wikipedia schauen, welche Sprache es ist.
Hat bitte jemand eine Idee?
Besten Dank und einen schönen Abend!