Описание тега gbk
GBK - это расширение набора символов GB2312 для упрощенных китайских иероглифов, используемых в Китайской Народной Республике.
1
ответ
Как написать Windows-936, чтобы войти Когда wchar_t в коде по boost.log
Следуйте на boost.log , sample.log был проанализирован как utf8. Теперь я хочу написать в windows.936, но код ниже бесполезен. void init_logging() { ... std::string strCodePage = boost::locale::util::get_system_locale();//strCodePage is "zh_CN.windo…
24 май '18 в 13:35
1
ответ
Форсировать исключение read_json, если в файле json есть какой-то китайский символ gbk
Есть такой json-файл без bom, используйте набор кодов gbk. Boost::property_tree может успешно его проанализировать в большинстве. try { boost::property_tree::read_json(filename, tree); } catch (exception &e) { cerr << e.what() << end…
31 июл '17 в 06:48
0
ответов
PySpark read GBK HDFS содержит китайские символы
У меня есть много больших файлов HDFS, закодированных в GBK, но эти файлы содержат специальные символы, включая китайский и т. Д. Эти китайские строки будут показаны или сохранены в файл. Как я могу справиться с проблемой? PySpark поддерживает тольк…
09 июн '17 в 05:07
1
ответ
GBK Encode/Decode Charset
Я получаю двоичный пакет с сервера, который содержит следующее: var data = new Uint8Array([0xB2, 0xE2, 0xCA, 0xD4, 0x74, 0x65, 0x73, 0x74, 0x31, 0x32, 0x33]); Я знаю, что это кодировка GBK, и я использую API TextDecoder / TextEncoder, чтобы прочитат…
17 апр '14 в 20:52
1
ответ
Странные символы после загрузки китайской таблицы из html
Я использую систему MAC OS X 10.12. Я скачал таблицу с http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2011/51/06/81/510681114.html. Таблица была закодирована с помощью GB2312, однако я использовал GBK для ее сохранения. Основная часть кода выгляди…
05 июл '17 в 08:42
1
ответ
Кодировка китайских символов (UTF-8, GBK)
У меня есть веб-сканер, который работает на разных веб-сайтах (в данном случае на китайском). Теперь, когда я получаю данные и отображаю их на своем веб-сайте, все китайские иероглифы оказываются мусором. Ну, я читал о кодировке символов, и я обнару…
14 янв '15 в 15:32
2
ответа
Как кодировать китайский символ как 'gbk' в json, чтобы отформатировать параметр запроса URL-адреса String?
Я хочу вывести dict как строку json, которая содержит несколько китайских символов, и отформатировать параметр запроса URL с этим. вот мой код Python: import httplib import simplejson as json import urllib d={ "key":"上海", "num":1 } jsonStr = json.du…
09 окт '14 в 04:32
1
ответ
Почему R & Studio в Mac не может импортировать RData с китайским контентом (создан в win10)
Я преследовал эту проблему в течение всего дня. Я скачал учебные материалы для учебника через: http://www.crup.com.cn/UploadFiles/jxkj/gsgl/243184/ rar 基于R 第二 第二版 版 rar.rar Тем не менее, эти RData хорошо работают в R & Rstudio в win10, но не могут о…
22 апр '18 в 17:23
1
ответ
Восстановление искаженного китайского формата и определение оригинальной китайской кодировки
Я работаю с файлом, который читает содержимое китайской Википедии и, по-видимому, каким-то образом преобразован в UTF-8, но не правильно. import re,urllib st=u'1492: Conquest ▒�¢â▒��¬â▒�▒¹of Paradise' st1= urllib.unquote(st).encode('UTF-8') st2= url…
29 апр '14 в 22:34
2
ответа
Как настроить приложение весенней загрузки для поддержки кодирования UTF-8 и GBK?
Я использую весеннюю загрузку в своем проекте, и я запускаю некоторые проблемы с кодировкой. В проекте есть контроллер (ниже), который принимает запрос с заголовком типа контента "application/x-www-form-urlencoded;charset=GBK". @RequestMapping(value…
09 окт '16 в 02:58
3
ответа
Как сравнить юникод и стр в Python
Мой код: a = '汉' b = u'汉' Эти два одинаковых китайских иероглифа. Но очевидно, a == b является False, Как это исправить? Обратите внимание, я не могу конвертировать a в utf-8 потому что у меня нет доступа к коду. Мне нужно конвертировать b в кодиров…
23 фев '14 в 14:01
1
ответ
В чем разница между gbk и cp936
Моя кодировка локали - "gbk" в других инструментах программирования, так как я упрощенный пользователь из Китая. Но в Python это "cp936". Я считаю, что "cp936" может быть таким же, как "gbk", потому что то, что "gbk" может || не может декодировать, …
08 июн '13 в 05:01
0
ответов
Как преобразовать кодировку данных HTTP GET из GBK в UTF8 в Titanium Mobile?
Сайты в Китае всегда используют gbk charset. Я пытаюсь получить данные с сайта: var url = "http://nga.178.com/thread.php?fid=7"; var client = Ti.Network.createHTTPClient({ // function called when the response data is available onload : function(e) {…
03 ноя '13 в 13:39
0
ответов
Установить автоматическое угадывание кодировки в коде
Я открыл авто угадать в vscode, все мои файлы закодированы в gbk или utf-8. обычно vscode ошибочно принимает мои файлы gbk как windows 1215 или ISO ***. Я хочу установить vscode для автоматического угадывания кодировки из gbk и utf-8, но теперь я не…
10 дек '18 в 01:56
1
ответ
Как начать цикл для выбранного ряда pandas.df?
При обработке pandas.df с помощью for. Я обычно сталкиваюсь с ошибками. Когда ошибка будет устранена, мне придется перезапустить цикл for в начале кадра данных. Как запустить цикл for с позиции ошибки, избавившись от повторного запуска? Например: se…
12 фев '19 в 14:22
1
ответ
Неправильный синтаксический анализ с анализатором GFF BCBio
Я экспериментирую с парсером GFF BCBio, в надежде, что смогу использовать его для своего инструмента. Я взял тестовый файл.gbk из базы данных RefSeq NCBI и использовал его для анализа в файл.gff. Код, который я использовал (с http://biopython.org/wi…
25 ноя '13 в 10:47
1
ответ
Как кодировать параметр как gbk вместо utf-8 с запросами cURL или python?
У меня странный API, он просто принимает gbk параметры, я собираю данные в Windows IE browser, показать данные с помощью этой команды: $ cat 12_Request.txt| iconv -f GBK -t UTF-8 GET http://10.202.15.197:20176/?user_id=1&query_type=GEOSPLIT&…
27 апр '17 в 02:44
1
ответ
scp файл в linux автоматически конвертирует имя файла в utf8
Как все мы знаем, Windows использует ANSII для кодирования имени файла в файловой системе, но Linux по умолчанию использует UTF-8. Когда я использую SCP или FTP/SFTP для передачи файлов из Windows в Linux, переданные файлы будут по-прежнему кодирова…
11 янв '16 в 16:00
1
ответ
Почему ISO 2022 определил 94- и 96-?
У меня есть некоторые сомнения по поводу стандарта ISO 2022: В чем разница между использованием 94-(0x21 - 0xFE) и 96-(0x20 - 0xFF)? Почему, например, в EUC-CN, код в CS1 использует только ограниченную область (94- 96-)? Почему это не занимает все? …
14 янв '17 в 04:26
2
ответа
Почему file.tell() влияет на кодировку?
Призвание tell() при чтении моего файла в кодировке GBK вызывает следующий вызов readline() поднять UnicodeDecodeError, Однако, если я не позвоню tell(), это не вызывает эту ошибку. C: \ tmp> hexdump badtell.txt 000000: 61 20 6B 0D 0A D2 BB B0-E3 a …
10 май '16 в 02:44