Кодировка Java String to UCS2 для писем с ударениями
У меня есть требование для кодирования строки, которая содержит иностранные символы, например. буквы с акцентом на символы UCS2 и следующий фрагмент кода, работающий с обычными английскими буквами.
String encodeAsUCS2(String test) throws UnsupportedEncodingException{
byte[] bytes = test.getBytes("UTF-16BE");
StringBuilder sb = new StringBuilder();
for (byte b : bytes) {
sb.append(String.format("%02X", b));
}
return sb.toString();
}
Это выводит шестнадцатеричную последовательность байтов UCS2/UTF16
например. привет = 00680065006C006C006F
Он сталкивается с проблемой с буквами, которые имеют акценты / иностранные символы, и отображает значение в виде FFFD, которое находится в таблице Specials и используется для указания проблем, когда система не может отобразить поток данных в правильный символ.
Любая работа вокруг этого?