Описание тега gb2312

2 ответа

Текстовый файл EUC-JP или GB18030

У меня есть текстовый файл со следующим содержанием:Ã(195) Ü(220) Â(195) ë(235) Ó(211) Ã(195) »(187) §(167) Ã(195) û(251) Ã(195) Ü(220) Â(194) ë(235) Ã(195) û(251) ³(179) Æ(198) Ã(195) û(251) ³(179) Æ(198), Для простоты наряду с текстом я добавил зн…
06 окт '15 в 07:01
1 ответ

Как получить КОД GB2312 из ввода китайских символов в Java

1) http://php.weather.sina.com.cn/search.php?city=%B1%B1%BE%A9&dpc;=1 2) http://php.weather.sina.com.cn/search.php?city=%C9%CF%BA%A3&dpc;=1 Существует небольшая разница в двух URL выше:%B1%B1%BE%A9 VS. %C9%CF%BA%A3на самом деле это было B1B1BEA9 &am…
07 янв '14 в 10:26
2 ответа

Преобразование utf8 в gb2312 в Java

Просто посмотрите на код ниже try { String str = "上海上海"; String gb2312 = new String(str.getBytes("utf-8"), "gb2312"); String utf8 = new String(gb2312.getBytes("gb2312"), "utf-8"); System.out.println(str.equals(utf8)); } catch (UnsupportedEncodingExc…
05 ноя '15 в 02:22
1 ответ

Этот символ - ㎜ - вызывает ошибку UnicodeEncodeError

Я использую скрипт Python для преобразования файлов из gb2312 в utf-8, Этот персонаж портит все: ㎜ (это один символ, а не "мм"). text = '㎜' text.encode(encoding='gb2312') поднимает эту ошибку: UnicodeEncodeError: кодек "gb2312" не может кодировать с…
25 ноя '12 в 16:54
3 ответа

Прочитать страницу кодирования GB2312, используя Ruby

Я пытаюсь проанализировать кодированную страницу GB2312 ( /questions/46522189/modulnoe-testirovanie-css/46522250#46522250), и это мой код. Я еще не в части синтаксического анализа, просто в открытом и прочитанном, и я получил ошибку. Это мой код: re…
25 авг '14 в 01:07
3 ответа

Быстрое удаление PercentEncoding не работает со строкой gb2312

Сервер возвращает строку gb2312, которая была обработана функцией urlencode: % D7% CF% BD% FB% B3% C7% C4% А7%D6%E4_%CE%DE%CF%DE%D0%A1%CB%B5%CD-%F8_www.55x.cn.rar Как декодировать его обратно в строку gb2312: 紫禁城 魔咒 _ 无限 小说 网 _www.55x.cn.rar
05 янв '17 в 03:45
1 ответ

Как преобразовать символы GB2312 (китайские) в UTF-8 внутри Weblogic 12?

У нас есть страницы, которые используют упрощенный китайский (GB2312) в форме HTML. Когда мы отправляем форму с 3 китайскими символами в текстовом поле, мы получаем 6 других символов (не на китайском языке) на сервере (Weblogic 12). Затем мы сохраня…
22 май '13 в 18:17
1 ответ

Использование китайских шрифтов в TCPDF и FPDI. Проблемы с кодированием

Я пишу сценарий, который генерирует листы китайских иероглифов (чтобы студенты могли создавать и практиковаться в написании) Скрипту передается строка из 15 символов из формы в index.php. Затем строка разбивается на массив из 15 элементов (каждый из…
08 май '15 в 11:59
2 ответа

PHP - UTF-8 на китайский ANSI (GB2312?) - экспорт файла CSV

Я публикую это после нескольких часов исследований (несколько раз...). Я не мог найти никакого ответа еще. Моя цель - написать файл CSV с использованием PHP. Этот файл должен иметь китайскую кодировку ANSI (я полагаю, это GB2312 для упрощенного кита…
27 июл '12 в 10:32
1 ответ

Странные символы после загрузки китайской таблицы из html

Я использую систему MAC OS X 10.12. Я скачал таблицу с http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2011/51/06/81/510681114.html. Таблица была закодирована с помощью GB2312, однако я использовал GBK для ее сохранения. Основная часть кода выгляди…
05 июл '17 в 08:42
2 ответа

=? проблема кодирования gb2312 и рекомендация

Я пишу код Java для декодирования входящего трафика электронной почты, закодированный с помощью =? Gb2312? и не всегда MimeUtility.decodeText() успешно выполняется с китайскими символами.Я вижу несколько рекомендаций для использования =? Gb18030? вм…
13 май '17 в 16:13
1 ответ

Отображение специальных символов с китайским языком в c

У меня есть требование адаптировать существующий, не-Unicode, c проект для отображения китайских символов. Поскольку существует короткий срок, и я новичок (C) в C и кодировании, я пошел по пути изменения локали системы на Упрощенный китайский КНР дл…
25 окт '12 в 09:07
5 ответов

Конвертировать GB2312 в UTF-8

У меня есть текстовый файл, содержащий локализованные языковые строки, который в настоящее время закодирован в GB2312 (упрощенный китайский), но все остальные мои языковые файлы находятся в UTF-8. Мне очень трудно работать с этим файлом, так как ни …
18 дек '08 в 20:43
1 ответ

Есть ли способ сделать преобразование между utf-8 и простой строкой, независимой от платформы?

Здесь plain string имеет вид кодирования, который: Обычный строковый литерал, такой как "plainstring" закодировано как; Все стандартные библиотеки возвращают или принимают. Например: std::cout << "I'm ok." ; // plain string, ok on my system, /…
20 янв '17 в 04:06
2 ответа

Как узнать, является ли персонаж GB2312 в Java

Я хотел бы написать функцию Java, как: если один символ не в GB2312, вернуть false Boolean isGB2312(String chinese) { ...... }
28 окт '10 в 10:25
2 ответа

PHP декодировать GB2312

Я работаю над сценарием электронной почты IMAP, и у меня есть несколько строк, закодированных в GB2312 (я предполагаю, что это китайская кодировка), выглядит так =?GB2312?B?foobarbazetc Как я могу начать работать с этой строкой? Я проверил mb_list_e…
30 дек '10 в 02:48
1 ответ

Как читать кодированные текстовые файлы GB2312 с помощью Swift 3.0

Мое приложение должно читать текстовые файлы, закодированные в GB2312. Вот текущий код. SGFString = try String(contentsOf:path) Это исключение. не может быть открыт, потому что текстовая кодировка его содержимого не может быть определена. При просмо…
30 янв '17 в 20:24
1 ответ

Ошибка Java? Не могу прочитать файл GB2312 со сканера напрямую

У меня есть файл в кодировке GB3212 (китайский). Файл загружается отсюда http://lingua.mtsu.edu/chinese-computing/statistics/char/list.php?Which=MO как есть с wget под Windows и сохраняется в файле ModernChineseCharacterFrequencyList.html. Приведенн…
05 янв '12 в 13:06
2 ответа

Как разобрать RSS с кодировкой GB2312 в Python

У меня есть RSS канал, который закодирован в GB2312 Когда я пытаюсь разобрать его, используя следующий код: for item in XML.ElementFromURL(feed).xpath('//item'): title = item.find('title').text Он не может разобрать ленту новостей. Любая идея, как р…
27 сен '11 в 12:39
1 ответ

Проблема кодировки charset - от Base64 до GB2312 до Base64

Я пытаюсь отобразить и обновить кодировку упрощенного Китая (GB2312), используя base64, Base64 в GB2312 работает нормально, но я не могу преобразовать GB2312 в base64 String str="17DP5Mqxx+vFxNXV"; Base64 base64=new Base64(); String gb2312=new Strin…
28 дек '12 в 20:58