Japanische Zeichen erkennen

Status
Nicht offen für weitere Antworten.
C

Chrisi

Gast
Hallo!

Mein erster Beitrag hier und ich hoffe mir kann jemand helfen.

Ich möchte aus einem japanischen Eingabetext (der Text ist derzeit in UTF-16), die Hiragana und Katakana erkennen und andersfärbig als die übrigen Kanji darstellen. Ich verwende Borland JBuilderX Personal Englische Version für WinXP.

Ich bin soweit, dass ich einen japanisches Textdokument öffnen und darstellen kann. Der Text ist dann in einem String als UTF-16 'codiert'. Ich kann nach lateinischen Zeichen suchen, aber wie suche ich nach Hiragana und Katakana? Ich kann die Zeichen nicht einfach in den Code schreiben, da mir die Zeichen im Code nicht richtig dargestellt werden.

Kann ich direkt den UTF16 Code für das Zeichen eingeben und danach suchen? Aber ich habe keine Ahung wie ich das mache und wie ich den Code darstellen soll, dass der Vergleich möglich ist. Es sind ja nur Zahlen und dann wird mir nach der Zahl gesucht und nicht nach dem eingentl. Hiragana/Katakana-Zeichen das die Zahl darstellen soll.
Wenn das mit UTF16 nicht geht, ist das auch kein Problem, kann auch eine ander Codierung sein, falls es dann einfacher geht. Solange ich irgendeine Möglichkeit finde die Zeichen zu erkennen.

Später sollen auch noch die Kanji erkannt werden, da allerdings nur zur Suche in einer Datenbank die den Shift JIS Code vom Kanji enthält. Ist es irgendwie möglich den Shift JIS Code des Kanji zu bekommen, um diesen dann für die DB Abfrage zu verwenden?

Ich hoffe die Frage war nicht zu konfus formuliert.
Bin für jede Hilfe wirklich dankbar,
Chrisi
 

Grizzly

Top Contributor
Mit den japanischen Schriftzeichen kenne ich mich leider nicht so, aber Du kannst die Zeichen auch kodieren. So musst Du keine japnischen Schriftzeichen direkt eingeben. Dafür schreibst Du
Code:
char ch = '\uXXXX';
Wobei XXXX der UTF-16 Code für das Zeichen ist.
 

EagleEye

Bekanntes Mitglied
sieh mal inner api nach da gibs wenn ich mich richtig erinnere für keyevent auch japanische erkennung vieleicht hilft dir das weiter
 
D

DrZoidberg

Gast
Chrisi hat gesagt.:
Ich kann nach lateinischen Zeichen suchen, aber wie suche ich nach Hiragana und Katakana? Ich kann die Zeichen nicht einfach in den Code schreiben, da mir die Zeichen im Code nicht richtig dargestellt werden.

Wenn dein Editor Unicode unterstützt, kannst du die Zeichen auch direkt eingeben. Java Quellcode darf auch im Unicode Format sein.
Ich weiss nicht, ob der JBuilder das kann, musst du mal das Menü durchsuchen.

Eine andere Möglichkeit wäre die Hex Codes einzugeben.
Geh auf http://code.cside.com/3rdpage/us/javaUnicode/converter.html
Gib dort die Zeichen, nach denen du suchen willst ein und er zeigt dir die Unicode Codes an, die du dann in den Java Quellcode einfügen kannst.
Das geht mit jedem Editor.


Später sollen auch noch die Kanji erkannt werden, da allerdings nur zur Suche in einer Datenbank die den Shift JIS Code vom Kanji enthält. Ist es irgendwie möglich den Shift JIS Code des Kanji zu bekommen, um diesen dann für die DB Abfrage zu verwenden?

Code:
import java.nio.charset.Charset;

String kanji="私"; // oder String kanji="\u79C1";

byte[] shiftjis;
try {
    shiftjis=kanji.getBytes("Shift_JIS");
} catch (java.io.UnsupportedEncodingException e) {
    System.out.println("Shift_JIS Unterstützung ist nicht installiert.");
}
for(int i=0; i<shiftjis.length; i++) {
            System.out.print(Integer.toString(shiftjis[i]&0xFF, 16));
}
 
D

DrZoidberg

Gast
Sieh mal auf http://ppewww.ph.gla.ac.uk/~flavell/unicode/unidata30.html
Dort kannst du sehen, dass Hiragana Symbole von 12353 bis 12447 gehen und Katakana Symbole von 12448 bis 12543.

Code:
char symbol;

if( symbol >= 12353 && symbol <= 12447) System.out.println("Hiragana");
if( symbol >= 12448 && symbol <= 12543) System.out.println("Katakana");
 
C

Chrisi

Gast
Die Antworten waren mir eine sehr große Hilfe.

Danke,
Chrisi
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
U Japanische Zeichen? Java Basics - Anfänger-Themen 11
S Japanische Schriftzeichen Java Basics - Anfänger-Themen 5
J Quelltext mit komischen griechischen Zeichen Java Basics - Anfänger-Themen 4
T or zeichen Java Basics - Anfänger-Themen 2
L 4 stelliges Passwort aus bestimmten Zeichen. Java Basics - Anfänger-Themen 27
R Größter zusammenhängender Block gleicher Zeichen im String Java Basics - Anfänger-Themen 1
O Zahlen aus einem char-array per char + Zeichen addieren Java Basics - Anfänger-Themen 2
I Eindeutiger String mit maximaler Anzahl an Zeichen Java Basics - Anfänger-Themen 11
A String split funktioniert nicht, wenn mehr als 1 Ziffer vor dem Zeichen steht nach dem er trennen soll? Java Basics - Anfänger-Themen 4
O Array mit einem Zeichen vergleichen Java Basics - Anfänger-Themen 1
S Was bedeutet das Zeichen := Java Basics - Anfänger-Themen 9
K Wie String prüfen ob drei mal das gleiche Zeichen vorkommt? Java Basics - Anfänger-Themen 7
L Zeichen an bestimmter Stelle auslesen Java Basics - Anfänger-Themen 4
S Arrayausgabe und nur einmal ein Zeichen davor Java Basics - Anfänger-Themen 12
johnboyne Java Zeichen Trennen Java Basics - Anfänger-Themen 1
T Zeichen im String verschiebe Java Basics - Anfänger-Themen 17
J Verschieben von Buchstaben in einem String um vorgegebene Anzahl von Zeichen innerhalb eines weiteren String Java Basics - Anfänger-Themen 12
Tino1993 for-Schleife, die eine vorgegebene Anzahl von Zeichen ausgibt Java Basics - Anfänger-Themen 3
pkm Regexproblem - Wie kann ich zwei oder mehr beliebige Zeichen matchen? Java Basics - Anfänger-Themen 7
marcooooo Separator zwischen allen Zeichen eines Strings einfügen Java Basics - Anfänger-Themen 29
Dimax Erste Schritte String replace alle Zeichen Java Basics - Anfänger-Themen 10
M Regex-Ausdruck: Alle Zeichen bis auf ein bestimmtes erlauben (p{L}) Java Basics - Anfänger-Themen 5
M Regex für bestimmte Wörter bzw. bestimmte Zeichen erstellen Java Basics - Anfänger-Themen 5
F RegEx "+" nur als Zeichen, nicht als Operator oder Sonstiges Java Basics - Anfänger-Themen 2
J Zeichen im String zählen Java Basics - Anfänger-Themen 3
J ObjectOutputStream writeChars, komische Zeichen nur in 1. Zeile Java Basics - Anfänger-Themen 2
H Fehlerausgabe (Ungewollte Zeichen) Java Basics - Anfänger-Themen 1
R Komische Zeichen in Java Java Basics - Anfänger-Themen 5
N Zeichen in einem Textfeld zählen und hinterlegen Java Basics - Anfänger-Themen 6
W Einfachen, ein beliebiges Zeichen oft erkennenden Regex Parser selber schreiben - wie vorgehen? Java Basics - Anfänger-Themen 12
J Vorkommen von Zeichen Java Basics - Anfänger-Themen 44
H Verschiebung von Zeichen Java Basics - Anfänger-Themen 18
O String von vorne nach hinten an einem Zeichen Java Basics - Anfänger-Themen 10
S char auf buchstabe/zeichen prüfen Java Basics - Anfänger-Themen 1
P Zeichenkette Zeichen ausschlißen funktioniert nicht richtig Java Basics - Anfänger-Themen 9
G Teil(e) eines Strings entfernen wenn spezifische Zeichen (< & >) vorkommen Java Basics - Anfänger-Themen 5
L String auf bestimmte zeichen untersuchen Java Basics - Anfänger-Themen 9
D gebe string zurück mit von bis bestimmtes Zeichen Java Basics - Anfänger-Themen 4
L Rekursion größtes Zeichen Java Basics - Anfänger-Themen 8
S Zeichen zählen kopierter Text Java Basics - Anfänger-Themen 6
Y String auf allgemein Zeichen untersuchen Java Basics - Anfänger-Themen 3
S String trennen nach beliebigen Zeichen Java Basics - Anfänger-Themen 3
C Zeichen im String bis zu bestimmter Stelle entfernen Java Basics - Anfänger-Themen 6
S Java Text splitten mit Tabs, Zeilen, Zeichen und Klammern. Java Basics - Anfänger-Themen 6
H Zeichen im algorithmus Java Basics - Anfänger-Themen 4
S Das Anführungszeichen(") Zeichen in einen String setzen Java Basics - Anfänger-Themen 1
G Zeichen suchen und Ausgeben. Java Basics - Anfänger-Themen 3
D Input/Output Split am Zeichen | Java Basics - Anfänger-Themen 2
B zeichen eines String mit der kleinsten Frequenz zurückgeben Java Basics - Anfänger-Themen 25
m0n4ch Variablen String auf ungültige Zeichen überprüfen Java Basics - Anfänger-Themen 13
Voreck String Zeichen für Zeichen auslesen Java Basics - Anfänger-Themen 9
R Zeichen in String vergleichen Java Basics - Anfänger-Themen 75
G Gibt es eine Methode die bei einem StringBuilder n mal das Zeichen c hinzufügt? Java Basics - Anfänger-Themen 6
D String Zeichen für Zeichen auslesen Java Basics - Anfänger-Themen 5
S Zeichen ab Suchstring einlesen Java Basics - Anfänger-Themen 6
Z char Array unbekanntes Zeichen selbstständig anlegen Java Basics - Anfänger-Themen 6
M Pipe-Zeichen "|" in Java Java Basics - Anfänger-Themen 1
S Zeichen von abgerundeten Rechtecken auf einem Applet Java Basics - Anfänger-Themen 5
R Anzahl von Zeichen in einem Char Array Java Basics - Anfänger-Themen 4
F StringBuilder: Zeilenumbruch nach x Zeichen ohne Worttrennung Java Basics - Anfänger-Themen 1
F Zeichen einer Datei zaehlen Java Basics - Anfänger-Themen 1
D Java doppelte Zahl/Zeichen in einem String entfernen Java Basics - Anfänger-Themen 6
W JTextField-Objekt liest Umlaute mit falschen Zeichen ein Java Basics - Anfänger-Themen 5
G zeichen einer Zeile löschen Java Basics - Anfänger-Themen 4
M problem mit diesem zeichen | Java Basics - Anfänger-Themen 10
N Bestimmte Zeichen eines Strings umwandeln Java Basics - Anfänger-Themen 4
W char-Array auf bestimmte Zeichen prüfen Java Basics - Anfänger-Themen 10
B lanterna einzelne Zeichen aus dem Terminal löschen Java Basics - Anfänger-Themen 0
S Input/Output Alphabet in eine Datei schreiben und Anzahl von Zeichen ausgeben. Java Basics - Anfänger-Themen 4
C Anzahl bestimmter Zeichen in einem String ausgeben Java Basics - Anfänger-Themen 7
I String abschneiden erste und letzte Zeichen Java Basics - Anfänger-Themen 3
X Wann schreibt man diese Syntax zeichen { } Java Basics - Anfänger-Themen 8
S Leerzeichen zwischen zwei Zeichen im String entfernen Java Basics - Anfänger-Themen 19
F Methoden split() - Mehrere Zeichen Java Basics - Anfänger-Themen 5
M Input/Output Text auf Fenster zeichen Java Basics - Anfänger-Themen 2
F In einem String nach einem String suchen und Zeichen danach ausgeben Java Basics - Anfänger-Themen 6
S Kleines Zeichen berechnen Java Basics - Anfänger-Themen 5
Q Erste Schritte Zeichen in String farblich hervorheben Java Basics - Anfänger-Themen 4
U markierten Text auf Zeichen zuvor/danach pruefen Java Basics - Anfänger-Themen 9
M Input/Output Zeichen on Konsole einlesen Java Basics - Anfänger-Themen 3
DStrohma Operatoren Kleiner-Zeichen in Größer-Zeichen ändern wenn boolen true? Java Basics - Anfänger-Themen 6
G Input/Output Verhalten BuffferedReader bei unvollständigen Zeichen Java Basics - Anfänger-Themen 1
T Auf jedes Zeichen eines Strings zugreifen? Java Basics - Anfänger-Themen 2
P String Zeichen zuweisen Java Basics - Anfänger-Themen 3
Q Erste Schritte In CharArrayWriter Zeichen an Stelle einfügen Java Basics - Anfänger-Themen 4
H Programm zum Zählen von Zeichen Java Basics - Anfänger-Themen 5
P Methode die String auf Zeichen überprüft Java Basics - Anfänger-Themen 2
A Seltsame Zeichen vor Clienteingabe Java Basics - Anfänger-Themen 5
M Prüfen, ob Zeichen eine Zahl ist Java Basics - Anfänger-Themen 3
T Wörter mit @ als Zeichen finden Java Basics - Anfänger-Themen 13
E Zeichen von Kommandozeilenparameter zählen Java Basics - Anfänger-Themen 6
W String von hinten alle drei Zeichen abschneiden und in umgekehrter Reihenfolge ausgeben. Java Basics - Anfänger-Themen 9
J String Ausgabe nicht-leerer Zeichen nicht korrekt Java Basics - Anfänger-Themen 10
H JEditorPane: ermitteln, ob Zeichen unterstrichen Java Basics - Anfänger-Themen 4
I Zeichen aus String ziehen Java Basics - Anfänger-Themen 3
X Klassen mit Suffix hinter @-Zeichen Java Basics - Anfänger-Themen 7
J Zeichen aus String Array lesen Java Basics - Anfänger-Themen 13
P Input/Output Textdatei einlesen - 1. Zeichen fehlt Java Basics - Anfänger-Themen 7
S Zeichen von Telnet lesen Java Basics - Anfänger-Themen 5
B Strings nur aus bestimmten Zeichen? Java Basics - Anfänger-Themen 4

Ähnliche Java Themen

Neue Themen


Oben