Какой самый длинный символ UTF-8 в байтах, который также присутствует в UCS-2?
Я хотел бы знать, какой символ Unicode присутствует в кодировке UCS-2 и UTF-8, который имеет самый длинный размер в байтах в UTF-8.
1 ответ
Решение
- UCS-2 может кодировать только кодовые точки в диапазоне от U+0000 до U + FFFF
- UTF-8 требуется не более 3 байтов для кодирования значений в этом диапазоне.
Таким образом, кодируемые UCS-2 кодовые точки с самым длинным представлением в UTF-8 будут от U+0800 до U+FFFF.