Почему UTF-32 использует четыре байта?

Если UTF-32 ограничен UCS-4 17 плоскостями (1114111 символьных точек), для которых требуется 21 бит, что делает четвертый байт?

1 ответ

Решение

Четвертый байт просто сидит там, занимая пространство (которое заполнено нулями).

Теоретически, может быть разработан 21-битный или 24-битный формат обмена. На практике они оба довольно неловкие. Немногие (если есть) современные компьютеры имеют 21- или 24-битные типы данных. Поскольку с 32-битными словами легко работать, их довольно часто используют для хранения числовых типов данных, максимумы которых значительно меньше 231-1.

Другие вопросы по тегам