Кодировка: имеет ли смысл пытаться декодировать строку ISO-8859-15 с китайскими символами в строку UTF-8?

У меня есть следующая строка, закодированная с ISO-8859-15, хранящаяся внутри файла:

DEBUG_RECEIVED: ????

Правильная строка UTF-8, хотя:

DEBUG_RECEIVED: 测试手机

Имеет ли смысл пытаться преобразовать те неправильно ???? персонажи снова в 测试手机 (поэтому снова с ISO-8859-15 до UTF-8), или это просто невозможно из-за того факта, что ISO-8859-15 не применяется для китайских символов и поскольку он использует 8 бит на символ, 16 бит необходимы для китайские иероглифы просто потерялись?

Когда я попробую следующее:

echo "DEBUG_RECEIVED: ????" | iconv -f iso-8859-15 -t utf-8

Я все еще получаю DEBUG_RECEIVED: ???? в качестве вывода.

Я немного запутался по этому поводу, пожалуйста, если вы можете уточнить эту деталь, было бы здорово.

Спасибо за внимание.

1 ответ

Решение

Да, все, что генерировало строку 8859-15, должно было отбрасывать информацию, необходимую для представления китайских символов.

Потерянная информация потеряна - кажется, ваши китайские иероглифы были заменены ?и нет ничего, что могло бы вернуть их.

Другие вопросы по тегам