Описание тега python-unicode
Python distinguishes between byte strings and unicode strings. *Decoding* transforms bytestrings to unicode; *encoding* transform unicode strings to bytes.
1
ответ
UnicodeDecodeError при использовании Python 2.x unicodecsv
Я пытаюсь записать CSV-файл с символами Unicode, поэтому я использую пакет Unicodecsv. К сожалению, я все еще получаю UnicodeDecodeErrors: # -*- coding: utf-8 -*- import codecs import unicodecsv raw_contents = 'He observes an “Oversized Gorilla” nea…
31 июл '14 в 15:26
1
ответ
Осколок python, сравнивающий юникодный список элементов со строкой
Я хочу получить весь текст тега привязки из iframe с именем "ListFirst". Я пытаюсь перебрать текст и сравниваю каждый из них со строкой "AGENT-WIN3E64", которую я хочу щелкнуть. Но сравнение, которое я здесь сделал, e['text'] == u'AGENT-WIN3E64 'ста…
13 май '16 в 15:33
2
ответа
Как разобрать строку байтов в Python 3?
По сути, у меня есть две строки байтов в одной строке, как это: b'\xe0\xa6\xb8\xe0\xa6\x96 - \xe0\xa6\xb6\xe0\xa6\x96\n' Это строка Unicode, которую я импортирую из онлайн-файла, используя urllibи я хочу сравнить отдельные байтовые строки, чтобы я м…
10 янв '18 в 04:16
2
ответа
Преобразование байта в str python2.7
У меня есть словарь k ={'Creator': '\xfe\xff\x00M\x00i\x00c\x00r\x00o\x00s\x00o\x00f\x00t\x00\xae\x00 \x00O\x00f\x00f\x00i\x00c\x00e\x00 \x00W\x00o\x00r\x00d\x00 \x002\x000\x000\x007'} который содержит метаданные PDF. В свойствах PDF Creator являетс…
15 фев '15 в 18:44
0
ответов
Чтение стандартного ввода вызывает UnicodeDecodeError
У меня есть программа для чтения стандартного ввода с помощью sys.stdin.read(), Stdin - это электронное письмо от postfix .forward. Иногда происходит UnicodeDecodeError (см. Удар). Как я должен читать содержимое электронной почты с Python из стандар…
11 дек '15 в 20:55
1
ответ
Разные питоны ведут себя среди разных SSH логинов?
У меня есть некоторые NTFS-диски, смонтированные в CentOS, и некоторые из них называются по-китайски. Я вхожу в Centos через Mac iTerm, но когда в моем офисе Mac, ls показывает правильное китайское имя файла, но в домашнем Mac ls просто покажи что-т…
08 сен '15 в 15:36
1
ответ
UnicodeEncodeError при доступе к БД в администраторе django
При попытке доступа к базе данных через администратора я получаю эту ошибку UnicodeEncodeError в /admin/nota_app/demographic/ Exception Type: UnicodeEncodeError Exception Value: 'ascii' codec can't encode character u'\x8e' in position 0: ordinal not…
06 янв '16 в 10:36
1
ответ
UnicodeEncodeError: кодек "ascii" не может кодировать символы в позиции 10-11: порядковый номер не в диапазоне (128)
Я пытаюсь сделать сценарий. Скрипт, который будет искать через файл.xls и распечатывать строки, для которых условия выполняются. У меня нет проблем с этим. У меня, однако, есть проблема, когда мне нужно записать эту строку в файл. это код: import xl…
10 фев '14 в 20:49
1
ответ
Использование Python в Windows ошибка: UnicodeDecodeError: кодек "utf-8" не может декодировать байт 0x80 в позиции 110: недопустимый начальный байт
Я использую tenorflow на Windows через Anaconda, в то время как он использует Python 3.6. Я запускаю этот код ( здесь), но я получил следующую ошибку: UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position 110: invalid start byte Может…
17 авг '17 в 20:59
0
ответов
Как обрабатывать ошибки кодирования в Python
Я работаю над анализом большого количества (90000) CSV-файлов. Некоторые из файлов преобразуются в текст из PDF. Таким образом, они имеют много шума в виде странных персонажей. Например, Cachï¿. Некоторые из этих файлов были преобразованы онлайн, а …
23 фев '17 в 08:17
2
ответа
Что такое кодировка "ANSI_X3.4-1968"?
Смотрите следующий вывод в моей системе: [STEP 101] # python3 -c 'import sys; print(sys.stdout.encoding)' ANSI_X3.4-1968 [STEP 102] # [STEP 103] # locale LANG=C LANGUAGE=en_US:en LC_CTYPE="C" LC_NUMERIC="C" LC_TIME="C" LC_COLLATE="C" LC_MONETARY="C"…
12 фев '18 в 09:27
1
ответ
Django не-ASCII символы в значениях тегов шаблонов
Я пишу пользовательский тег шаблона Django для французского приложения. Мой шаблонный тег принимает параметр, который является строкой: {% mytag "Hello" %} Работает отлично, но завершается неудачно при попытке ввести в значение некоторые символы, не…
29 май '15 в 13:47
0
ответов
UnicodeEncodeError для обработки CSV на Apache Beam в Python
Я работаю над анализом файла CSV в Apache Beam Python. Однако, когда в CSV-файле есть символы Unicode, такие как "ş", он не может выполнить синтаксический анализ с ошибкой. RuntimeError: UnicodeEncodeError: 'ascii' codec can't encode character u'\u0…
07 янв '19 в 13:08
4
ответа
Как обрабатывать Python 3.x UnicodeDecodeError в пакете электронной почты?
Я пытаюсь прочитать письмо из файла, например так: import email with open("xxx.eml") as f: msg = email.message_from_file(f) и я получаю эту ошибку: Traceback (most recent call last): File "I:\fakt\real\maildecode.py", line 53, in <module> main…
02 май '13 в 16:34
3
ответа
python: динамическое приведение типов - преобразование объекта Unicode в объект Python
Это проблема, с которой я сталкиваюсь для проекта конвейера данных. У меня есть 2 источника данных. Один содержит все пользовательские данные, другой содержит метаданные о том, что все столбцы мы должны обработать от пользовательских данных до вывод…
03 май '18 в 06:46
2
ответа
Чтение из листа Excel и запись точных символов в файл json
У меня есть лист Excel, и я читаю из него и записываю значения, прочитанные в файл json. Но проблема в том, что символы написаны не так, как они есть. Например: если текст "Молба", он записывается как "\u041b\u0438\u0447\u043d\u0430" в кодировке Uni…
14 авг '18 в 07:37
1
ответ
UnicodeDecodeError: кодек "ascii" не может декодировать байт 0xd0 в позиции 8: порядковый номер не в диапазоне (128)
Я пытался написать программу на Python, которая считывает значения ячеек из файла Excel, переводит содержимое ячейки с эстонского на английский или русский и объединяет их в одну строку. Результаты печатаются в текстовый файл. Эстонский -> Английски…
04 июн '13 в 09:02
1
ответ
UnicodeDecodeError: кодек "utf-8" не может декодировать байт 0x80
Есть много подобных вопросов, и я попробовал каждое возможное решение, но, кажется, не могу решить его. Это мой код, и я работаю над распознаванием имен с помощью Stanford Tagger. from nltk.tag import StanfordNERTagger st = StanfordNERTagger('stanfo…
30 апр '17 в 06:44
1
ответ
pytest 3.0.5 с кириллическими символами
У меня проблема с отображением имен тестов с русским текстом в путях к файлам в pytest-3.0.5. Когда я запускаю на pytest == 2.9.2 - все в порядке: py.test -s -q --collect-only Выход: test_card.py::test_graphic_card[/root/test_cases/files/Кредитная_к…
26 дек '16 в 16:59
2
ответа
Trying to Read inner key, value from unicode JSON in python
I am trying to get key value from below unicode JSON is python messagejson={ u'Records': [ { u'requestParameters': {u'sourceIPAddress': u'113.112.10.06'}, u'sql': {u'configurationId': u'note', u'object': {u'eTag': u'ed3645fa5ee', u'sequencer': u'005…
08 окт '18 в 19:03