Конвертировать числовые объекты в читаемый формат

У меня есть следующая строка, хранящаяся в базе данных в формате Unicode.

كنت قد دخلت بالفعل في مكان آخر من

Теперь я хочу преобразовать эту строку в читаемый формат. На Java, как я могу это сделать?

1 ответ

Решение

Поскольку это HTML-сущности, вам нужен какой-то библиотечный метод, который преобразует их в символы, которые они представляют.

Apache Commons имеет StringEscapeUtils.unescapeHtml например, и я уверен, что есть много других.

Если вы действительно хотите что-то накатить, то для этого конкретного случая вы можете пометить числа между &# а также ;, разобрать их как шестнадцатеричный int, и вызвать Character.toChars преобразовать их в символы Java. Тем не менее, это займет больше работы и будет содержать больше ошибок, чем использование библиотеки, и я уверен, что в спецификации есть крайние случаи, которые я подчеркиваю.

Либо должен дать результат

ᘃᘆᕸ ᘂᖃ ᖃᖂᘄᕸ ᕶᕵᘄᘁᖓᘄ ᘁᘐ ᘅᘃᕵᘆ ᕰᖂᖅ ᘅᘆ

(Кстати, я думаю, что вы должны быть более конкретными о том, что вы подразумеваете под "читаемым форматом". Я могу прочитать эту строку прямо сейчас - это последовательность ссылок на сущности. Вы разработчик, если быть точным!)

Другие вопросы по тегам