Кодировка и набор символов для iso-8859-1

Question

Кодировка и набор символов для iso-8859-1

Я прочитал статью Джоэла о кодировках. Как я понимаю в случае Unicode:

Юникод - это набор символов - отображение между целочисленным значением и символом
utf-8 - это кодировка, которая используется для целых чисел Юникода, чтобы представить их в двоичном представлении

Что насчет iso-8859-1? Это кодировка или набор символов или оба?

1

unicode encoding utf-8 iso-8859-1

Источник

user1057767 22 июл '16 в 08:48

2 ответа

Решение

ISO 8859-1 (Latin-1) является однобайтовой кодировкой. Он представляет первые 256 символов Юникода. Таким образом, пока это подмножество набора символов Unicode, я полагаю, что его можно рассматривать как кодировку и набор символов.

1

Источник

user4563745 23 июл '16 в 22:36

Другие вопросы по тегам unicode encoding utf-8 iso-8859-1

user18936 24 июл '16 в 11:01 2016-07-24 11:01 · Accepted Answer · 2016-07-24 11:01

Что насчет iso-8859-1? Это кодировка или набор символов или оба?

Исторически он был описан как набор кодированных символов: он определял как набор символов, так и отображение этих символов в байтовые значения - то, что мы сегодня называем кодировкой, но это не было явно описано в этих терминах.

Когда был создан Unicode, он был разработан, чтобы охватить (почти) все символы в широко используемых наборах символов, и, следовательно, он преобразовал поток байтов, определенный набором кодированных символов ISO-8859-1, в кодировку более широкого универсального набора символов.

Поэтому, если вы работаете в современной среде Unicode, вы можете считать ISO-8859-1 кодировкой. Но нельзя сказать, что это неправильно, считать его также набором символов.

(Существуют и другие кодировки, которые определенно не являются наборами символов: например, UTF и многобайтовые кодировки, такие как Shift-JIS, который сам был определен как кодировка для набора символов JIS X 0208 до расширения и кодирования Unicode.)