Описание тега python-unicode

Python distinguishes between byte strings and unicode strings. *Decoding* transforms bytestrings to unicode; *encoding* transform unicode strings to bytes.
1 ответ

UnicodeDecodeError при использовании Python 2.x unicodecsv

Я пытаюсь записать CSV-файл с символами Unicode, поэтому я использую пакет Unicodecsv. К сожалению, я все еще получаю UnicodeDecodeErrors: # -*- coding: utf-8 -*- import codecs import unicodecsv raw_contents = 'He observes an “Oversized Gorilla” nea…
31 июл '14 в 15:26
1 ответ

Осколок python, сравнивающий юникодный список элементов со строкой

Я хочу получить весь текст тега привязки из iframe с именем "ListFirst". Я пытаюсь перебрать текст и сравниваю каждый из них со строкой "AGENT-WIN3E64", которую я хочу щелкнуть. Но сравнение, которое я здесь сделал, e['text'] == u'AGENT-WIN3E64 'ста…
13 май '16 в 15:33
2 ответа

Как разобрать строку байтов в Python 3?

По сути, у меня есть две строки байтов в одной строке, как это: b'\xe0\xa6\xb8\xe0\xa6\x96 - \xe0\xa6\xb6\xe0\xa6\x96\n' Это строка Unicode, которую я импортирую из онлайн-файла, используя urllibи я хочу сравнить отдельные байтовые строки, чтобы я м…
2 ответа

Преобразование байта в str python2.7

У меня есть словарь k ={'Creator': '\xfe\xff\x00M\x00i\x00c\x00r\x00o\x00s\x00o\x00f\x00t\x00\xae\x00 \x00O\x00f\x00f\x00i\x00c\x00e\x00 \x00W\x00o\x00r\x00d\x00 \x002\x000\x000\x007'} который содержит метаданные PDF. В свойствах PDF Creator являетс…
15 фев '15 в 18:44
0 ответов

Чтение стандартного ввода вызывает UnicodeDecodeError

У меня есть программа для чтения стандартного ввода с помощью sys.stdin.read(), Stdin - это электронное письмо от postfix .forward. Иногда происходит UnicodeDecodeError (см. Удар). Как я должен читать содержимое электронной почты с Python из стандар…
11 дек '15 в 20:55
1 ответ

Разные питоны ведут себя среди разных SSH логинов?

У меня есть некоторые NTFS-диски, смонтированные в CentOS, и некоторые из них называются по-китайски. Я вхожу в Centos через Mac iTerm, но когда в моем офисе Mac, ls показывает правильное китайское имя файла, но в домашнем Mac ls просто покажи что-т…
08 сен '15 в 15:36
1 ответ

UnicodeEncodeError при доступе к БД в администраторе django

При попытке доступа к базе данных через администратора я получаю эту ошибку UnicodeEncodeError в /admin/nota_app/demographic/ Exception Type: UnicodeEncodeError Exception Value: 'ascii' codec can't encode character u'\x8e' in position 0: ordinal not…
06 янв '16 в 10:36
1 ответ

UnicodeEncodeError: кодек "ascii" не может кодировать символы в позиции 10-11: порядковый номер не в диапазоне (128)

Я пытаюсь сделать сценарий. Скрипт, который будет искать через файл.xls и распечатывать строки, для которых условия выполняются. У меня нет проблем с этим. У меня, однако, есть проблема, когда мне нужно записать эту строку в файл. это код: import xl…
10 фев '14 в 20:49
1 ответ

Использование Python в Windows ошибка: UnicodeDecodeError: кодек "utf-8" не может декодировать байт 0x80 в позиции 110: недопустимый начальный байт

Я использую tenorflow на Windows через Anaconda, в то время как он использует Python 3.6. Я запускаю этот код ( здесь), но я получил следующую ошибку: UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position 110: invalid start byte Может…
0 ответов

Как обрабатывать ошибки кодирования в Python

Я работаю над анализом большого количества (90000) CSV-файлов. Некоторые из файлов преобразуются в текст из PDF. Таким образом, они имеют много шума в виде странных персонажей. Например, Cachï¿. Некоторые из этих файлов были преобразованы онлайн, а …
23 фев '17 в 08:17
2 ответа

Что такое кодировка "ANSI_X3.4-1968"?

Смотрите следующий вывод в моей системе: [STEP 101] # python3 -c 'import sys; print(sys.stdout.encoding)' ANSI_X3.4-1968 [STEP 102] # [STEP 103] # locale LANG=C LANGUAGE=en_US:en LC_CTYPE="C" LC_NUMERIC="C" LC_TIME="C" LC_COLLATE="C" LC_MONETARY="C"…
12 фев '18 в 09:27
1 ответ

Django не-ASCII символы в значениях тегов шаблонов

Я пишу пользовательский тег шаблона Django для французского приложения. Мой шаблонный тег принимает параметр, который является строкой: {% mytag "Hello" %} Работает отлично, но завершается неудачно при попытке ввести в значение некоторые символы, не…
0 ответов

UnicodeEncodeError для обработки CSV на Apache Beam в Python

Я работаю над анализом файла CSV в Apache Beam Python. Однако, когда в CSV-файле есть символы Unicode, такие как "ş", он не может выполнить синтаксический анализ с ошибкой. RuntimeError: UnicodeEncodeError: 'ascii' codec can't encode character u'\u0…
4 ответа

Как обрабатывать Python 3.x UnicodeDecodeError в пакете электронной почты?

Я пытаюсь прочитать письмо из файла, например так: import email with open("xxx.eml") as f: msg = email.message_from_file(f) и я получаю эту ошибку: Traceback (most recent call last): File "I:\fakt\real\maildecode.py", line 53, in <module> main…
3 ответа

python: динамическое приведение типов - преобразование объекта Unicode в объект Python

Это проблема, с которой я сталкиваюсь для проекта конвейера данных. У меня есть 2 источника данных. Один содержит все пользовательские данные, другой содержит метаданные о том, что все столбцы мы должны обработать от пользовательских данных до вывод…
2 ответа

Чтение из листа Excel и запись точных символов в файл json

У меня есть лист Excel, и я читаю из него и записываю значения, прочитанные в файл json. Но проблема в том, что символы написаны не так, как они есть. Например: если текст "Молба", он записывается как "\u041b\u0438\u0447\u043d\u0430" в кодировке Uni…
14 авг '18 в 07:37
1 ответ

UnicodeDecodeError: кодек "ascii" не может декодировать байт 0xd0 в позиции 8: порядковый номер не в диапазоне (128)

Я пытался написать программу на Python, которая считывает значения ячеек из файла Excel, переводит содержимое ячейки с эстонского на английский или русский и объединяет их в одну строку. Результаты печатаются в текстовый файл. Эстонский -> Английски…
04 июн '13 в 09:02
1 ответ

UnicodeDecodeError: кодек "utf-8" не может декодировать байт 0x80

Есть много подобных вопросов, и я попробовал каждое возможное решение, но, кажется, не могу решить его. Это мой код, и я работаю над распознаванием имен с помощью Stanford Tagger. from nltk.tag import StanfordNERTagger st = StanfordNERTagger('stanfo…
1 ответ

pytest 3.0.5 с кириллическими символами

У меня проблема с отображением имен тестов с русским текстом в путях к файлам в pytest-3.0.5. Когда я запускаю на pytest == 2.9.2 - все в порядке: py.test -s -q --collect-only Выход: test_card.py::test_graphic_card[/root/test_cases/files/Кредитная_к…
26 дек '16 в 16:59
2 ответа

Trying to Read inner key, value from unicode JSON in python

I am trying to get key value from below unicode JSON is python messagejson={ u'Records': [ { u'requestParameters': {u'sourceIPAddress': u'113.112.10.06'}, u'sql': {u'configurationId': u'note', u'object': {u'eTag': u'ed3645fa5ee', u'sequencer': u'005…
08 окт '18 в 19:03