Почему UTF-32 использует четыре байта?
Если UTF-32 ограничен UCS-4 17 плоскостями (1114111 символьных точек), для которых требуется 21 бит, что делает четвертый байт?
1 ответ
Решение
Четвертый байт просто сидит там, занимая пространство (которое заполнено нулями).
Теоретически, может быть разработан 21-битный или 24-битный формат обмена. На практике они оба довольно неловкие. Немногие (если есть) современные компьютеры имеют 21- или 24-битные типы данных. Поскольку с 32-битными словами легко работать, их довольно часто используют для хранения числовых типов данных, максимумы которых значительно меньше 231-1.