Konvertierung von UTF-8 in Entities

Hallo Java-Experten,

ich möchte eine Datei in UTF-8 Kodierung so umwandeln, dass die Sonderzeichen (alle außer 7-Bit ASCII) als Entities kodiert sind, also z.B. in Α oder Α oder &0x0391; .

Kennt jemand eine entsprechende Java-Klasse?

CU
Markus

Hallo Markus,

ich möchte eine Datei in UTF-8 Kodierung so umwandeln, dass
die Sonderzeichen (alle außer 7-Bit ASCII) als Entities
kodiert sind, also z.B. in Α oder Α oder &0x0391; .

Das ist relativ leicht zu schreiben:

 final StringBuffer b = new StringBuffer();
 for (int i = 0; i = '\u0000' && ch 

Wenn es für einen Filter im JSP/Servlet Umfeld sein soll, dann könnte es Probleme geben, wenn der Client ein IE unter MacOSX ist. Ebenso ein Netscape/Mozilla unter MacOSX.
Dort wird ein Schekel (Israelische Währung), oder auch ein Dong (Thailändische Währung) i.d.R. falsch dargestellt. Da wird irgendein Wert in der Zeichenroutine gecacht :frowning:((
Also Vorsicht.

Gruss,
Frank

ich möchte eine Datei in UTF-8 Kodierung so umwandeln, dass
die Sonderzeichen (alle außer 7-Bit ASCII) als Entities
kodiert sind, also z.B. in Α oder Α oder &0x0391; .

Das ist relativ leicht zu schreiben:

[…]

Hallo Frank,

vielen Dank für den Code!

Mir war nicht bewusst, dass UTF-8 und Unicode dieselben Zeichencodes verwenden (nur einmal byteweise kodiert und einmal als lesbare Hexadezimalzahl).

Leider komme ich momentan nicht zum Testen. Ich wollte mich aber zumindest schon einmal bedanken!

CU
Markus