Сохранение китайских символов с использованием Java HtmlEditorKit

Я пытаюсь сохранить HtmlDocument(сохраненный с кодировкой UTF-8), который содержит символы китайского языка с использованием HtmlEditorKit следующим образом:

try (OutputStreamWriter f = new OutputStreamWriter(fileOutputStream, "UTF-8")) {
    htmlEditorKit.write(f, htmlDocument, 0, htmlDocument.getLength());
} catch (BadLocationException e) {
    logger.error("Could not save", e);
}

В выходном HTML-документе я получаю два 2-байтовых символа (amp#55361;amp#57102;) вместо одного 4-байтового символа. Java может понять, какой это символ, комбинируя их оба, но HTML не может.
Любое предложение о том, как его сохранить, чтобы HTML-страница могла корректно отображаться?

Вот вывод html:

<html>
<head>
<meta content="text/html" charset="utf-8">
</head>
<body>
<p>&#55361;&#57102;</p>
</body>
</html>

0 ответов

Другие вопросы по тегам