Описание тега python-unicode

Описание тега Вопросы с тегом

Python distinguishes between byte strings and unicode strings. *Decoding* transforms bytestrings to unicode; *encoding* transform unicode strings to bytes.

1 ответ

UnicodeDecodeError при использовании Python 2.x unicodecsv

Я пытаюсь записать CSV-файл с символами Unicode, поэтому я использую пакет Unicodecsv. К сожалению, я все еще получаю UnicodeDecodeErrors: # -*- coding: utf-8 -*- import codecs import unicodecsv raw_contents = 'He observes an “Oversized Gorilla” nea…

python unicode python-unicode

31 июл '14 в 15:26

1 ответ

Осколок python, сравнивающий юникодный список элементов со строкой

Я хочу получить весь текст тега привязки из iframe с именем "ListFirst". Я пытаюсь перебрать текст и сравниваю каждый из них со строкой "AGENT-WIN3E64", которую я хочу щелкнуть. Но сравнение, которое я здесь сделал, e['text'] == u'AGENT-WIN3E64 'ста…

python-unicode splinter

13 май '16 в 15:33

2 ответа

Как разобрать строку байтов в Python 3?

По сути, у меня есть две строки байтов в одной строке, как это: b'\xe0\xa6\xb8\xe0\xa6\x96 - \xe0\xa6\xb6\xe0\xa6\x96\n' Это строка Unicode, которую я импортирую из онлайн-файла, используя urllibи я хочу сравнить отдельные байтовые строки, чтобы я м…

python python-3.5 python-unicode string-parsing bytestring

10 янв '18 в 04:16

2 ответа

Преобразование байта в str python2.7

У меня есть словарь k ={'Creator': '\xfe\xff\x00M\x00i\x00c\x00r\x00o\x00s\x00o\x00f\x00t\x00\xae\x00 \x00O\x00f\x00f\x00i\x00c\x00e\x00 \x00W\x00o\x00r\x00d\x00 \x002\x000\x000\x007'} который содержит метаданные PDF. В свойствах PDF Creator являетс…

python python-2.7 decode python-unicode

15 фев '15 в 18:44

0 ответов

Чтение стандартного ввода вызывает UnicodeDecodeError

У меня есть программа для чтения стандартного ввода с помощью sys.stdin.read(), Stdin - это электронное письмо от postfix .forward. Иногда происходит UnicodeDecodeError (см. Удар). Как я должен читать содержимое электронной почты с Python из стандар…

python stdin python-unicode

11 дек '15 в 20:55

1 ответ

Разные питоны ведут себя среди разных SSH логинов?

У меня есть некоторые NTFS-диски, смонтированные в CentOS, и некоторые из них называются по-китайски. Я вхожу в Centos через Mac iTerm, но когда в моем офисе Mac, ls показывает правильное китайское имя файла, но в домашнем Mac ls просто покажи что-т…

linux character-encoding python-unicode ntfs

08 сен '15 в 15:36

1 ответ

UnicodeEncodeError при доступе к БД в администраторе django

При попытке доступа к базе данных через администратора я получаю эту ошибку UnicodeEncodeError в /admin/nota_app/demographic/ Exception Type: UnicodeEncodeError Exception Value: 'ascii' codec can't encode character u'\x8e' in position 0: ordinal not…

python django unicode encoding python-unicode

06 янв '16 в 10:36

1 ответ

UnicodeEncodeError: кодек "ascii" не может кодировать символы в позиции 10-11: порядковый номер не в диапазоне (128)

Я пытаюсь сделать сценарий. Скрипт, который будет искать через файл.xls и распечатывать строки, для которых условия выполняются. У меня нет проблем с этим. У меня, однако, есть проблема, когда мне нужно записать эту строку в файл. это код: import xl…

python excel encoding python-unicode

10 фев '14 в 20:49

1 ответ

Использование Python в Windows ошибка: UnicodeDecodeError: кодек "utf-8" не может декодировать байт 0x80 в позиции 110: недопустимый начальный байт

Я использую tenorflow на Windows через Anaconda, в то время как он использует Python 3.6. Я запускаю этот код ( здесь), но я получил следующую ошибку: UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position 110: invalid start byte Может…

python python-3.x tensorflow utf-8 python-unicode

17 авг '17 в 20:59

0 ответов

Как обрабатывать ошибки кодирования в Python

Я работаю над анализом большого количества (90000) CSV-файлов. Некоторые из файлов преобразуются в текст из PDF. Таким образом, они имеют много шума в виде странных персонажей. Например, Cachï¿. Некоторые из этих файлов были преобразованы онлайн, а …

python python-2.7 encoding nltk python-unicode

23 фев '17 в 08:17

2 ответа

Что такое кодировка "ANSI_X3.4-1968"?

Смотрите следующий вывод в моей системе: [STEP 101] # python3 -c 'import sys; print(sys.stdout.encoding)' ANSI_X3.4-1968 [STEP 102] # [STEP 103] # locale LANG=C LANGUAGE=en_US:en LC_CTYPE="C" LC_NUMERIC="C" LC_TIME="C" LC_COLLATE="C" LC_MONETARY="C"…

python python-3.x python-unicode

12 фев '18 в 09:27

1 ответ

Django не-ASCII символы в значениях тегов шаблонов

Я пишу пользовательский тег шаблона Django для французского приложения. Мой шаблонный тег принимает параметр, который является строкой: {% mytag "Hello" %} Работает отлично, но завершается неудачно при попытке ввести в значение некоторые символы, не…

python django django-templates tags python-unicode

29 май '15 в 13:47

0 ответов

UnicodeEncodeError для обработки CSV на Apache Beam в Python

Я работаю над анализом файла CSV в Apache Beam Python. Однако, когда в CSV-файле есть символы Unicode, такие как "ş", он не может выполнить синтаксический анализ с ошибкой. RuntimeError: UnicodeEncodeError: 'ascii' codec can't encode character u'\u0…

python csv google-cloud-dataflow apache-beam python-unicode

07 янв '19 в 13:08

4 ответа

Как обрабатывать Python 3.x UnicodeDecodeError в пакете электронной почты?

Я пытаюсь прочитать письмо из файла, например так: import email with open("xxx.eml") as f: msg = email.message_from_file(f) и я получаю эту ошибку: Traceback (most recent call last): File "I:\fakt\real\maildecode.py", line 53, in <module> main…

python python-3.x exception unicode python-unicode

02 май '13 в 16:34

3 ответа

python: динамическое приведение типов - преобразование объекта Unicode в объект Python

Это проблема, с которой я сталкиваюсь для проекта конвейера данных. У меня есть 2 источника данных. Один содержит все пользовательские данные, другой содержит метаданные о том, что все столбцы мы должны обработать от пользовательских данных до вывод…

python django-models type-conversion python-unicode dynamictype

03 май '18 в 06:46

2 ответа

Чтение из листа Excel и запись точных символов в файл json

У меня есть лист Excel, и я читаю из него и записываю значения, прочитанные в файл json. Но проблема в том, что символы написаны не так, как они есть. Например: если текст "Молба", он записывается как "\u041b\u0438\u0447\u043d\u0430" в кодировке Uni…

python json python-unicode

14 авг '18 в 07:37

1 ответ

UnicodeDecodeError: кодек "ascii" не может декодировать байт 0xd0 в позиции 8: порядковый номер не в диапазоне (128)

Я пытался написать программу на Python, которая считывает значения ячеек из файла Excel, переводит содержимое ячейки с эстонского на английский или русский и объединяет их в одну строку. Результаты печатаются в текстовый файл. Эстонский -> Английски…

python-2.7 unicode python-unicode

04 июн '13 в 09:02

1 ответ

UnicodeDecodeError: кодек "utf-8" не может декодировать байт 0x80

Есть много подобных вопросов, и я попробовал каждое возможное решение, но, кажется, не могу решить его. Это мой код, и я работаю над распознаванием имен с помощью Stanford Tagger. from nltk.tag import StanfordNERTagger st = StanfordNERTagger('stanfo…

python encoding utf-8 stanford-nlp python-unicode

30 апр '17 в 06:44

1 ответ

pytest 3.0.5 с кириллическими символами

У меня проблема с отображением имен тестов с русским текстом в путях к файлам в pytest-3.0.5. Когда я запускаю на pytest == 2.9.2 - все в порядке: py.test -s -q --collect-only Выход: test_card.py::test_graphic_card[/root/test_cases/files/Кредитная_к…

python py.test python-unicode

26 дек '16 в 16:59

2 ответа

Trying to Read inner key, value from unicode JSON in python

I am trying to get key value from below unicode JSON is python messagejson={ u'Records': [ { u'requestParameters': {u'sourceIPAddress': u'113.112.10.06'}, u'sql': {u'configurationId': u'note', u'object': {u'eTag': u'ed3645fa5ee', u'sequencer': u'005…

python json python-2.7 python-unicode

08 окт '18 в 19:03