Eclipse Xtext - richtiges Werkzeug für "Textbearbeitung"/ Data Mining??

frasch333

Neues Mitglied
Hallo zusammen,

ich studiere Computerlinguistik und schreibe gerade meine Bachelorarbeit.

Kurz zur Aufgabenstellung:

Habe in einer Textdatei ein zweisprachiges Wörterbuch vorliegen. Einträge zu einem Lemma können wie folgt aussehen: "abitant m Bewohner, Einwohner; ~s da la chasa (chesa), Hausbewohner, Hausinsassen; ~s da cunfin, Grenzbewohner;" Ich soll nun, dieses Wörterbuch umstellen, sodass am Ende statt "abitant - Einwohner" "Einwohner - abitant" dort steht. Der Rest des Eintrags kann verworfen werden. Das ganze soll unter dem Titel "Rekonstruierung von Ressourcen. Xtext für lexikalisches Data Mining" stehen.

Habe Java gelernt und damit wäre es für mich auch kein Problem, diese Aufgabe zu erledigen. Mein Professor hat nun allerdings etwas von Xtext gehört und findet, dass ich damit arbeiten sollte - also eine DSL in Xtext erstellen und mit dieser das Wörterbuch parsen. Habe nun seit über einer Woche alle Tutorials zu Xtext (und Xpand und Xtend)und alle Papers etc. gelesen und an sich auch verstanden - verstehe aber noch immer nicht, wie ich meine Aufgabe damit sinnvoll lösen kann. Finde nirgends einen ähnlichen Anwendungsfall, in dem ein Text eingelesen, analysiert und bearbeitet und wieder "ausgegeben" wird. Mir reinem Java-Code wäre ich schon längst fertig...

Bin ziemlich am verzweifeln, weshalb ich nun hoffe, auf diesem Weg irgendwie weiterzukommen.
Hat irgendwer irgendwelche Tipps oder Empfehlungen, was ich wo lesen/ mir anschauen könnte, um weiterzukommen?!

Kann es vielleicht auch sein, dass Xtext einfach nicht das richtige Werkzeug für diese Aufgabe ist? So kommt es mir nämlich momentan vor.
Wie gesagt, mein Professor hat selbst nie mit Xtext gearbeitet und es könnte daher durchaus möglich sein, dass es hier nicht das erfüllt, was es in seinen Augen soll?


Oder gehört meine Frage gar nicht in dieses Forum? Dann: einfach löschen!

Hoffe auf Antworten!

Grüße


frasch333
 

Andi_CH

Top Contributor
Ich kenne xtext nicht, aber mir erscheint das totaler overkill, ausser es ist nicht so einfach wie ich es sehe ;-)

Wie sind denn die Regeln welches "Feld" du aus dem ganzen Eintrag brauchst?
Ich würde den String aufsplitten und das erste sowie das dazu passende Wort herausholen.
 

Jens81

Gesperrter Benutzer
Prof's schnappen viele Dinge einfach nur iwo auf, ohne je selbst damit gearbeitet oder sich richtig darüber informiert zu haben. Sowas wird dann auch schonmal an Studenten "zur Bearbeitung" weitergegeben - und es kann durchaus vorkommen, dass es nicht so wie vom Prof. gedacht zu lösen ist.

Das sind zumindest meine Erfahrungen aus der Studienzeit.
 

Neue Themen


Oben