Hallo miteinander,
ich habe mal eine Anfängerfrage zu regulären Ausdrücken in Java. Ich möchte gern in einem String alle "HTML-Unicode-Zeichen" durch "Java-Unicode-Zeichen" ersetzen.
Ich stelle mir das so vor:
und habe dafür eine Funktion toUnicode
Irgendwie finde ich jedoch im Moment nicht so recht heraus, wie die Treffer meiner Gruppe im regulären Ausdruck auf der Seite der Ersetzung aussehen. $1 habe ich als Perl-Programmierer irgendwie intuitiv übernommen, aber das scheint in Java irgendwie anders auszusehen.
Würde mich freuen, wenn ihr mir da kurz auf die Sprünge helfen könnt
ich habe mal eine Anfängerfrage zu regulären Ausdrücken in Java. Ich möchte gern in einem String alle "HTML-Unicode-Zeichen" durch "Java-Unicode-Zeichen" ersetzen.
Ich stelle mir das so vor:
Java:
String meinText = [VIELTEXT];
meinText = meinText.replaceAll( "&#(\\d*);", toUnicode( $1 ) );
und habe dafür eine Funktion toUnicode
Java:
String toUnicode( int c )
{
return "\\u"+Integer.toString(c,16);
}
Irgendwie finde ich jedoch im Moment nicht so recht heraus, wie die Treffer meiner Gruppe im regulären Ausdruck auf der Seite der Ersetzung aussehen. $1 habe ich als Perl-Programmierer irgendwie intuitiv übernommen, aber das scheint in Java irgendwie anders auszusehen.
Würde mich freuen, wenn ihr mir da kurz auf die Sprünge helfen könnt