Описание тега utf-32
UTF-32 - это кодировка символов, которая представляет все кодовые точки Unicode в четырех байтах на символ.
UTF-32 - это кодировка символов, которая представляет все кодовые точки Юникода в четырех байтах каждая. Таким образом, это единственная (своего рода, в зависимости от того, насколько глубоко вы углубитесь) кодировка Unicode фиксированной ширины.
Существуют варианты UTF-32, различающиеся порядком байтов.
Алгоритм кодирования кодовых точек как UTF-32 описан в RFC 2781.