![]() |
|
|
|||||||
| Java Basics - Anfänger-Themen Fragen ausschließlich zu Java-Grundlagen von Ein- und Umsteigern |
|
|
|
Themen-Optionen | Thema durchsuchen | Ansicht |
| #21 (permalink) | |
|
Benutzer
int
Themenstarter
Registriert seit: 04.09.2012
Fachbeiträge: 33
Abgegebene Danke: 7
Erhielt 1 Danke für 1 Beitrag
|
Die Folge der Zeichenkette ist völlig egal. Auch wenn ein Sonderzeichen mit "reingerutscht" ist, ein buchstabe vergessen wurde (d.h. Die Zeichenkettelänge nicht korrekt ist) oder sonstiges.
Natürlich wird er bei z.b. Richtige Namen: Sven, Svenja und eingetippten Namen: vSen, #Sven, Sv en , etc Dir eine Auswahl zwischen den beiden oben genannten geben. |
|
|
|
| #22 (permalink) | |
|
Benutzer
int
Themenstarter
Registriert seit: 04.09.2012
Fachbeiträge: 33
Abgegebene Danke: 7
Erhielt 1 Danke für 1 Beitrag
|
Meine weitere Überlegung..
Mit dem Algo den ich jetzt geschrieben habe, bekommt man eine Auswahl an möglichen Worten vorgegeben. Hat jemand eine Idee die (nur noch wenige Möglichkeiten) noch vorgegebenen Wörter zu filtern? z.b. man hat vSen eingegeben. der Algo spuckt 2 Möglichkeiten heraus wie Sven und Svenja da beide Wörter gleichviele Übereinstimmungen haben. Wie könnte ich nun das richtige Wort gerausfiltern ? (Wobei das Problem ein schlechtes Beispiel ist da nun die Frage ist, ist das "ja" von Svenja vergessen worden/Tippfehler oder wollte man Sven schreiben) |
|
|
|
| #23 (permalink) | |
|
Stammbenutzer
Viertel Megabyte
Registriert seit: 26.04.2012
Fachbeiträge: 299
Abgegebene Danke: 124
Erhielt 10 Danke für 8 Beiträge
|
Da es sich um Namen Handelt, die weder in der Rechtschreibung noch in Wörterbücher zu finden sind, kommt mir da die Idee eine Namensdatenbank an zu legen, mit der abgeglichen wird.
Denn das wird man niemals über einen Algorithmus allein lösen können. Mi |
|
|
|
| #25 (permalink) | |
|
Stammbenutzer
Viertel Megabyte
Registriert seit: 26.04.2012
Fachbeiträge: 299
Abgegebene Danke: 124
Erhielt 10 Danke für 8 Beiträge
|
OK, dann hast du schon eine Quelle mit der die Namen abgeglichen werden kann.
Ich setze das ein ähnliches Verfahren ein um in Dokumente bestimmte Wörter zu finden. Mi. |
|
|
|
| #27 (permalink) | |
|
Stammbenutzer
Viertel Megabyte
Registriert seit: 26.04.2012
Fachbeiträge: 299
Abgegebene Danke: 124
Erhielt 10 Danke für 8 Beiträge
|
Ja das wünsche ich mir auch manchmal, aber leider läßt sich das in bestimmten Situationen auch nicht vermeiden. Der Unterschied zwischen Sven und Svenja ist ja teilweise identisch und woher soll der Algorithmus wissen, um welches Geschlecht es geht.
Der Gedanke liegt nahe zu erkennen ob der Inhalt an eine männliche oder weibliche Person gerichtet ist. Das wäre eine Option, die mir so spontan einfällt. Ich kämpfe auch zur Zeit mit dem Problem, dass ich verschiedene Datumsangaben habe und dann das richtige heraus ermitteln muss, was eine echt knifflige Angelegenheit ist. mi |
|
|
|
| #29 (permalink) | |
|
Stammbenutzer
Viertel Megabyte
Registriert seit: 26.04.2012
Fachbeiträge: 299
Abgegebene Danke: 124
Erhielt 10 Danke für 8 Beiträge
|
Du siehst das falsch, das Gehirn ist da, was dem PC fehlt ist die Ausbildung.
![]() Klasse 1 bis 13 und dann noch das Studium. ![]() Das musst du übernehmen weil der ist doof wie Bohnenstroh.Am besten verknüpfe all das ganze wissen was Du bekommen kannst in die Applikation, dann wird es schon werden. ![]() mi |
|
|
|
| #31 (permalink) | |
|
Stammbenutzer
Viertel Megabyte
Registriert seit: 26.04.2012
Fachbeiträge: 299
Abgegebene Danke: 124
Erhielt 10 Danke für 8 Beiträge
|
Ich selbst versuche demnächst Apache Lucene und UIMA zusammen mit Semantik zu verwenden, damit die Texte auch der Inhaltlich Sinn erkannt und Strukturiert wird.
mi |
|
|
|
|
| Themen-Optionen | Thema durchsuchen |
| Ansicht | |
| Lesezeichen |
|
|