Конвертировать числовые объекты в читаемый формат
У меня есть следующая строка, хранящаяся в базе данных в формате Unicode.
كنت قد دخلت بالفعل في مكان آخر من
Теперь я хочу преобразовать эту строку в читаемый формат. На Java, как я могу это сделать?
1 ответ
Поскольку это HTML-сущности, вам нужен какой-то библиотечный метод, который преобразует их в символы, которые они представляют.
Apache Commons имеет StringEscapeUtils.unescapeHtml
например, и я уверен, что есть много других.
Если вы действительно хотите что-то накатить, то для этого конкретного случая вы можете пометить числа между &#
а также ;
, разобрать их как шестнадцатеричный int, и вызвать Character.toChars
преобразовать их в символы Java. Тем не менее, это займет больше работы и будет содержать больше ошибок, чем использование библиотеки, и я уверен, что в спецификации есть крайние случаи, которые я подчеркиваю.
Либо должен дать результат
ᘃᘆᕸ ᘂᖃ ᖃᖂᘄᕸ ᕶᕵᘄᘁᖓᘄ ᘁᘐ ᘅᘃᕵᘆ ᕰᖂᖅ ᘅᘆ
(Кстати, я думаю, что вы должны быть более конкретными о том, что вы подразумеваете под "читаемым форматом". Я могу прочитать эту строку прямо сейчас - это последовательность ссылок на сущности. Вы разработчик, если быть точным!)