UCS2 против UTF. Какие языки не могут отображаться в кодировке UCS2?
UCS2 проще использовать в Visual C++, чем в кодировке UTF. Какие языки я не могу поддерживать в кодировке UCS2?
2 ответа
Решение
Ничего, о чем вы, вероятно, не заботитесь, или, что более важно, у вас есть шрифты. UCS2 дает вам базовую многоязычную плоскость; Вы можете найти обзоры назначенных самолетов на сайте Unicode
- 0 - базовая многоязычная плоскость
- 1 - дополнительная многоязычная плоскость (древние символы, клингон и т. Д.)
- 2 - Дополнительная идеографическая плоскость (CJK унифицированные расширения иероглифов)
- 3 - третичный идеографический план (древние китайские иероглифы)
- 14 - Дополнительная плоскость специального назначения (обозначения и варианты символов -?)
Конечно, если у вас действительно есть поддержка UTF-16, вы все равно можете получить доступ ко всем этим, но если вы спрашиваете, можете ли вы их игнорировать, то на практике, вероятно, да.
Веб-сайт Unicode.org содержит индекс блоков кода в порядке кодирования, из которого видно, что начиная с Unicode 6.0, плоскость 1 включает в себя:
- Линейный С Силлабари
- Линейные B идеограммы
- Эгейские числа
- Старый Курсив
- готика
- угаритский
- дезерет
- в стиле Шоу
- Османья
- Кипрская Силлабари
- Византийские Музыкальные Символы
- Музыкальные символы
- Тай Сюань Цзин Символы
- Математические буквенно-цифровые символы
и плоскость 2 включает в себя:
- CJK Унифицированное расширение иероглифов B
- Дополнение к идеографам CJK
- Теги
- Дополнение селекторов вариаций