Кодировка: имеет ли смысл пытаться декодировать строку ISO-8859-15 с китайскими символами в строку UTF-8?
У меня есть следующая строка, закодированная с ISO-8859-15, хранящаяся внутри файла:
DEBUG_RECEIVED: ????
Правильная строка UTF-8, хотя:
DEBUG_RECEIVED: 测试手机
Имеет ли смысл пытаться преобразовать те неправильно ????
персонажи снова в 测试手机
(поэтому снова с ISO-8859-15 до UTF-8), или это просто невозможно из-за того факта, что ISO-8859-15 не применяется для китайских символов и поскольку он использует 8 бит на символ, 16 бит необходимы для китайские иероглифы просто потерялись?
Когда я попробую следующее:
echo "DEBUG_RECEIVED: ????" | iconv -f iso-8859-15 -t utf-8
Я все еще получаю DEBUG_RECEIVED: ????
в качестве вывода.
Я немного запутался по этому поводу, пожалуйста, если вы можете уточнить эту деталь, было бы здорово.
Спасибо за внимание.
1 ответ
Да, все, что генерировало строку 8859-15, должно было отбрасывать информацию, необходимую для представления китайских символов.
Потерянная информация потеряна - кажется, ваши китайские иероглифы были заменены ?
и нет ничего, что могло бы вернуть их.