Какой самый длинный символ UTF-8 в байтах, который также присутствует в UCS-2?

Я хотел бы знать, какой символ Unicode присутствует в кодировке UCS-2 и UTF-8, который имеет самый длинный размер в байтах в UTF-8.

1 ответ

Решение
  • UCS-2 может кодировать только кодовые точки в диапазоне от U+0000 до U + FFFF
  • UTF-8 требуется не более 3 байтов для кодирования значений в этом диапазоне.

Таким образом, кодируемые UCS-2 кодовые точки с самым длинным представлением в UTF-8 будут от U+0800 до U+FFFF.

Другие вопросы по тегам