C
Chrisi
Gast
Hallo!
Mein erster Beitrag hier und ich hoffe mir kann jemand helfen.
Ich möchte aus einem japanischen Eingabetext (der Text ist derzeit in UTF-16), die Hiragana und Katakana erkennen und andersfärbig als die übrigen Kanji darstellen. Ich verwende Borland JBuilderX Personal Englische Version für WinXP.
Ich bin soweit, dass ich einen japanisches Textdokument öffnen und darstellen kann. Der Text ist dann in einem String als UTF-16 'codiert'. Ich kann nach lateinischen Zeichen suchen, aber wie suche ich nach Hiragana und Katakana? Ich kann die Zeichen nicht einfach in den Code schreiben, da mir die Zeichen im Code nicht richtig dargestellt werden.
Kann ich direkt den UTF16 Code für das Zeichen eingeben und danach suchen? Aber ich habe keine Ahung wie ich das mache und wie ich den Code darstellen soll, dass der Vergleich möglich ist. Es sind ja nur Zahlen und dann wird mir nach der Zahl gesucht und nicht nach dem eingentl. Hiragana/Katakana-Zeichen das die Zahl darstellen soll.
Wenn das mit UTF16 nicht geht, ist das auch kein Problem, kann auch eine ander Codierung sein, falls es dann einfacher geht. Solange ich irgendeine Möglichkeit finde die Zeichen zu erkennen.
Später sollen auch noch die Kanji erkannt werden, da allerdings nur zur Suche in einer Datenbank die den Shift JIS Code vom Kanji enthält. Ist es irgendwie möglich den Shift JIS Code des Kanji zu bekommen, um diesen dann für die DB Abfrage zu verwenden?
Ich hoffe die Frage war nicht zu konfus formuliert.
Bin für jede Hilfe wirklich dankbar,
Chrisi
Mein erster Beitrag hier und ich hoffe mir kann jemand helfen.
Ich möchte aus einem japanischen Eingabetext (der Text ist derzeit in UTF-16), die Hiragana und Katakana erkennen und andersfärbig als die übrigen Kanji darstellen. Ich verwende Borland JBuilderX Personal Englische Version für WinXP.
Ich bin soweit, dass ich einen japanisches Textdokument öffnen und darstellen kann. Der Text ist dann in einem String als UTF-16 'codiert'. Ich kann nach lateinischen Zeichen suchen, aber wie suche ich nach Hiragana und Katakana? Ich kann die Zeichen nicht einfach in den Code schreiben, da mir die Zeichen im Code nicht richtig dargestellt werden.
Kann ich direkt den UTF16 Code für das Zeichen eingeben und danach suchen? Aber ich habe keine Ahung wie ich das mache und wie ich den Code darstellen soll, dass der Vergleich möglich ist. Es sind ja nur Zahlen und dann wird mir nach der Zahl gesucht und nicht nach dem eingentl. Hiragana/Katakana-Zeichen das die Zahl darstellen soll.
Wenn das mit UTF16 nicht geht, ist das auch kein Problem, kann auch eine ander Codierung sein, falls es dann einfacher geht. Solange ich irgendeine Möglichkeit finde die Zeichen zu erkennen.
Später sollen auch noch die Kanji erkannt werden, da allerdings nur zur Suche in einer Datenbank die den Shift JIS Code vom Kanji enthält. Ist es irgendwie möglich den Shift JIS Code des Kanji zu bekommen, um diesen dann für die DB Abfrage zu verwenden?
Ich hoffe die Frage war nicht zu konfus formuliert.
Bin für jede Hilfe wirklich dankbar,
Chrisi