Unicode

blub85 · 12. Sep 2007

Hallo!

Wir haben folgende Aufgabe zu lösen:

Es soll eine Klasse namens Words erstellt werden, mit deren Hilfe Informationen zu den Wörtern in Texten ermittelt werden können. Die Texte enthalten beliebige Unicode-Zeichen im Bereich zwischen \u0000 bis \u007E . Als Worttrenner dienen ausschließlich die folgenden Zeichen: das Leerzeichen \u0020, das Tabulatorzeichen \t, die Zeilenschaltung \n und der Seitenumbruch \f. Die Wörter zu einem Text erhält man also, indem man den Text an allen Worttrennern zerlegt. Dabei sollen keinen leeren Wörter entstehen, wenn mehr als zwei Worttrenner aufeinanderfolgen.

Ich habe dazu, bzw. über den UniCode folgende Fragen:

1)

Der Text enthält Zeichen zwischen "\u0000 bis \u007E".

Versuch ich beisielsweise:

Code:

char blub = '\u0000';
System.out.println((char) blub);

Zeigt er mir kein reguläres zeichen an, sondern so eine Art Quadrat. Liegt der Fehler an mir, oder ist das am Schluss sogar das Zeichen, das man mit \u0000 ansprechen kann ??

2)

Wenn ich nun den Text durchgehe (beispielsweise mit text.charAt(i) und ner for-schleife auf i), wie kann ich dann überprüfen ob er einen Zeilensprung drinnen hat ?? Das leerzeichen hat ja "einen Index zum Ansprechen", nämlich }\u0020. Wie kann ich die andern aufgezählten Sachen (\t, \n und \f) "erkennen"?

Vielen Dank für Euer Bemühen!!

Noar · 12. Sep 2007

Zu 1:

Am besten du schnappst dir eine Übersicht, wie z.B.: http://unicode.org/charts/PDF/U0000.pdf, dort sind alle von dir zu nutzenden Zeichen enthalten. Da kannst du dann schauen, ob dein Ergebnis stimmt.

Bei \u0000 handelt es sich um ein Steuerzeichen, daher die "merkwürdige" Darstellung.

Zu2:
Auch auch Tabulator, Newline etc. lassen sind in Unicode als Steuerzeichen enthalten. Sind auch in der oben genannten Übersicht zu finden.

Hoffe, das hilft.

homeboy · 25. Nov 2007

bei mir werden auch nur kästchn ausgegeben, wenn ich zahlen in unicode darstellen will

	Titel	Forum	Antworten	Datum
R	Jshell unter Windows: Unicode-Zeichen werden als Fragezeichen ausgegeben	Java Basics - Anfänger-Themen	5	1. Dez 2024
	Zusammengesetztes Unicode	Java Basics - Anfänger-Themen	15	31. Okt 2016
D	Unicode im Hexadezimalsystem	Java Basics - Anfänger-Themen	1	10. Jun 2015
A	Input/Output Input eingabe in unicode übersetzen	Java Basics - Anfänger-Themen	3	16. Mai 2015
F	charAt-Methode liefert falsche Unicode-Werte	Java Basics - Anfänger-Themen	8	29. Sep 2012
U	Unicode - ?	Java Basics - Anfänger-Themen	3	24. Dez 2011
P	Zahlen als Unicode darstellen	Java Basics - Anfänger-Themen	2	20. Okt 2011
F	Unicode beim Lesen und Schreiben per java.io.*	Java Basics - Anfänger-Themen	9	17. Mrz 2011
0	"Invalid Unicode"	Java Basics - Anfänger-Themen	2	19. Jan 2011
M	Import Unicode Textfile	Java Basics - Anfänger-Themen	10	28. Okt 2010
A	Unicode	Java Basics - Anfänger-Themen	3	26. Okt 2009
K	Java String UNICODE in DB UTF-8 Feld einfügen	Java Basics - Anfänger-Themen	3	11. Mai 2009
	Char und Unicode	Java Basics - Anfänger-Themen	2	27. Dez 2008
J	Unicode-Textdatei lesen	Java Basics - Anfänger-Themen	7	10. Dez 2008
H	short in unicode umwandeln	Java Basics - Anfänger-Themen	5	2. Okt 2008
R	Unicode-Wert in Binär und Dezimal umformen - kleines Problem	Java Basics - Anfänger-Themen	1	13. Mai 2008
G	ASCII -> Unicode ?	Java Basics - Anfänger-Themen	5	4. Mrz 2008
R	Problem bei Ausgabe von Unicode-Zeichen	Java Basics - Anfänger-Themen	6	28. Sep 2007
G	Aus int das unicode char zeichen lesen	Java Basics - Anfänger-Themen	3	19. Aug 2007
D	Unicode für mathematische/statistische Zeichen.	Java Basics - Anfänger-Themen	3	19. Jul 2007
T	Textdateien mit Unicode-Zeichen kopieren	Java Basics - Anfänger-Themen	2	13. Mai 2007
	Unicode aus Textdatei einlesen und wieder abspeichern	Java Basics - Anfänger-Themen	13	14. Feb 2007
D	Unicode in Html	Java Basics - Anfänger-Themen	4	5. Dez 2006
I	Probleme mit String Byte[] und Unicode	Java Basics - Anfänger-Themen	15	16. Nov 2006
R	Unicode ausgeben: für b "u0062" ausgeben	Java Basics - Anfänger-Themen	5	10. Nov 2006
I	Zahlen in Unicode konvertieren	Java Basics - Anfänger-Themen	37	16. Mai 2006
G	mit Strings rechnen (Unicode)	Java Basics - Anfänger-Themen	15	27. Dez 2005
M	Buchstabe zu Unicode	Java Basics - Anfänger-Themen	3	11. Dez 2005
M	Byte InputStream zu Zeichenformat Unicode bzw String konvert	Java Basics - Anfänger-Themen	5	8. Nov 2005
S	HTML Sonderzeichen in Unicode wandeln	Java Basics - Anfänger-Themen	5	26. Okt 2005
T	Unicode StringBuffer -> String = unleserlich	Java Basics - Anfänger-Themen	7	31. Mrz 2005
S	HTML mit num. Unicode Notation (was:Probleme bei Encoding)	Java Basics - Anfänger-Themen	7	6. Mrz 2005
G	Unicode in Java	Java Basics - Anfänger-Themen	2	13. Sep 2004

Unicode

blub85

Gast

Noar

Bekanntes Mitglied

homeboy

Mitglied

Ähnliche Java Themen

Aktuelle Jobs

Neue Themen