PHP декодировать GB2312
Я работаю над сценарием электронной почты IMAP, и у меня есть несколько строк, закодированных в GB2312 (я предполагаю, что это китайская кодировка), выглядит так =?GB2312?B?foobarbazetc
Как я могу начать работать с этой строкой? Я проверил mb_list_encodings()
и этот не указан.
2 ответа
Решение
Если у вас есть данные, декодированные в base64, используйте mbstring или iconv. Если у вас есть необработанный заголовок, то mbstring.
<?php
$t = "\xc4\xe3\xba\xc3\n";
echo iconv('GB2312', 'UTF-8', $t);
echo mb_convert_encoding($t, 'UTF-8', 'GB2312');
mb_internal_encoding('UTF-8');
echo mb_decode_mimeheader("=?gb2312?b?xOO6ww==?=");
?>
Игнасио решил проблему с mb_decode_mimeheader()
но для дальнейшего использования эти ссылки также полезны:
- http://developer.loftdigital.com/blog/php-utf-8-cheatsheet
- http://www.herongyang.com/PHP-Chinese/PHP-UTF-8-Chinese-String-Literals.html
Конкретная строка заголовка, с которой я работал:
$subject = "=?GB2312?B?tPC4tDogUXVvdGF0aW9uIFBJSSBwcm9kdWN0cyA=?= =?GB2312?B?Rk9CIFNoYW5naGFpIG9yIE5pbmdibyBwb3J0?="
Это требует заголовка страницы
<meta http-equiv="content-type" content="text/html; charset=utf-8" />
и PHP
mb_internal_encoding('utf-8');
echo mb_decode_mimeheader($subject)."<br />";
выводить
主题: Quotation PII products FOB Shanghai or Ningbo port