Описание тега unicode-literals
Используйте этот тег для вопросов, связанных с литералами Unicode. Пример: ( u'some text'), который представляет собой объект, отличный от байтовой строки ( 'some text').
2
ответа
Java: как конвертировать UTF-8 (в буквальном смысле) в Unicode
У меня UTF-8(в буквальном смысле), как это "\xE2\x80\x93." Я пытаюсь преобразовать это в Unicode, используя Java. Но я не смог найти способ преобразовать это. Может ли кто-нибудь помочь мне в этом? С уважением, сб
23 июн '13 в 16:00
2
ответа
Строковые литералы Python Unicode:: В чем разница между '\u0391' и u'\u0391'
Я использую Python 2.7.3. Кто-нибудь может объяснить разницу между литералами: '\u0391' а также: u'\u0391' и другой способ, которым они отражены в REPL ниже (особенно дополнительная косая черта, добавленная к a1): >>> a1='\u0391' >>&g…
28 янв '13 в 09:55
1
ответ
UnicodeEncodeError при форматировании u'ES SIOUF_1'в Python 2
У меня есть этот код: "'{}'".format(u'ES SIOUF_1') При запуске в Python 2 я получаю следующую ошибку: Traceback (most recent call last): File "<interactive input>", line 1, in <module> UnicodeEncodeError: 'ascii' codec can't encode chara…
25 сен '18 в 12:31
2
ответа
Подпроцесс Python отображает литерал Юникода
Я знаю, что такие вопросы задавались раньше. Но я не нахожу решения. Я хочу использовать литерал Unicode, определенный в моем файле Python, с модулем подпроцесса. Но я не получаю результаты, которые мне нужны. Например, следующий код # -*- coding: u…
05 май '15 в 13:57
0
ответов
Настройте SQL Server для использования литералов Unicode по умолчанию
Мы переносим классическое приложение ASP с использованием SQL Server на мультиязычность, и для этого в качестве первого шага мы должны перейти с кодировки ansi / windows-1252 на Unicode. Мы успешно переместили программы ASP (сохранив затем в UTF-8 с…
24 авг '18 в 17:16
1
ответ
Получение вывода на консоль win при вызове исключения, содержащего литерал unicode (u"\u0410")
Я столкнулся с неясной проблемой, когда поднятое исключение Python было напечатано на консоли win. Когда сообщение об исключении содержит какой-либо юникодный литерал, оно вообще не печатается или печатается неправильно. Консольная кодировка cp866 К…
18 сен '12 в 21:11
2
ответа
Как вы можете безопасно объявить 16-битный строковый литерал в C?
Я знаю, что уже есть стандартный метод с префиксом L: wchar_t *test_literal = L"Test"; Проблема в том, что wchar_t не гарантируется, что он будет 16-битным, но для моего проекта мне нужен 16-битный wchar_t, Я также хотел бы избежать требования прохо…
02 июн '18 в 14:23
4
ответа
Считайте эмодзи одним персонажем в регулярном выражении
Вот небольшой пример: reg = ur"((?P<initial>[+\-])(?P<rest>.+?))$" (В обоих случаях файл имеет -*- coding: utf-8 -*-) В Python 2: re.match(reg, u"hello").groupdict() # => {u'initial': u'\ud83d', u'rest': u'\udc4dhello'} # unicode why …
16 янв '18 в 05:53
5
ответов
Как добавить Unicode литерал в переменную?
Я видел несколько примеров, подобных этому: for name in os.listdir(u'somedir') : моя проблема в том, что я получаю somedir как переменную, так как я могу добавить литерал 'u'? что-то вроде for name in ops.listdir(u+somedir) ?
09 авг '12 в 17:51
1
ответ
Указание кодировки литерала Unicode для каждого литерала
Согласно документации, можно определить кодировку литералов, используемых в источнике Python, следующим образом: # -*- coding: latin-1 -*- u = u'abcdé' # This is a unicode string encoded in latin-1 Есть ли поддержка синтаксиса для определения кодиро…
17 окт '13 в 07:11
1
ответ
Заменить все литералы Юникода в строке соответствующим символом
У меня есть стандартная строка Python3, содержащая несколько литералов Unicode (например, "\u00c6")Мне нужно превратить их обратно в соответствующие им символы (Скандинавские буквы: æ, ø, å) Я попытался погуглить его и используя .encode() а также .d…
30 ноя '17 в 13:31
3
ответа
Unicode буквенная строка
Я посылаю некоторые JSON в запрос HTTP пост. часть текста внутри объекта json должна иметь верхние индексы. если я создаю свою строку в C# как: string s = "here is my superscript: \u00B9"; он преобразует \u00B9 в фактический верхний индекс 1, что на…
24 июн '13 в 16:34
1
ответ
Регулярные выражения и литералы Юникода
Я хотел бы удалить некоторые символы из строки (байтовой строки или строки Юникода) с помощью регулярного выражения, например: pattern = re.compile(ur'\u00AE|\u2122', re.UNICODE) Если символы указаны как литералы Юникода, результирующее регулярное в…
23 ноя '11 в 16:08
0
ответов
Удаление общих слов в питоне
Как удалить общие слова из двух документов, извлеченных из двух сайтов? Я уже извлек новость с двух сайтов, теперь я хочу удалить общие слова из двух документов. Я использовал следующий код для извлечения новостей с двух разных сайтов: from __future…
14 мар '17 в 16:14
0
ответов
Как я могу preg_replace буквальный синтаксис Unicode?
У меня есть большой набор данных, который был преобразован из данных JSON. Он содержит символы Юникода с использованием JSON-совместимой нотации \uXXXX. Я пытаюсь преобразовать их в настоящий Unicode на лету, используя preg_replace. preg_replace('/\…
23 июн '17 в 10:54
1
ответ
Как использовать литералы Unicode с ключом командной строки Node.js -e "оценивать скрипт"
Node.js имеет -e переключатель командной строки для оценки кода, предоставленного в командной строке, а не в отдельном файле сценария. Как ни странно, я не могу найти официальную документацию для него в Интернете, но исполняемый файл узла самодокуме…
09 фев '16 в 12:52
1
ответ
Маркировка текста символами Юникода
Я использую markjs ( https://markjs.io/) в своем проекте. Это в основном используется для выделения текста. Он работает хорошо, за исключением некоторого текста с символами Юникода в нем. Например, текст с символами "\xA0" Вот ссылка на jsfiddle для…
07 мар '17 в 13:42
1
ответ
Как правильно использовать `__attribute__((format (printf, x, y)))` для C11 U"литералы юникода"?
Я портирую приложение с помощью char* для всего и повсюду, чтобы использовать UCS4 в качестве внутреннего представления Unicode. Я использую С11 U"unicode literals" для определения строк, которые расширяются до массивов char32_t, которые uint32_t по…
04 ноя '14 в 18:46
2
ответа
Как мне преобразовать строку "\u{0026}" в "&" в Swift?
У меня есть строка, которая может содержать символы Юникода в форме "\u{0026}", и я хочу, чтобы она была преобразована в соответствующий символ "&". Как я могу это сделать? let input = "\\u{0026} something else here" let expectedOutput = "& some…
21 дек '16 в 09:23
2
ответа
Как обеспечить, чтобы все строковые литералы были в кодировке Unicode в Python
У меня есть довольно большая база кода Python, чтобы пройти. Есть проблема, когда некоторые строковые литералы являются строками, а другие - юникодом. И это вызывает ошибки. Я пытаюсь преобразовать все в Unicode. Мне было интересно, если есть инстру…
16 мар '13 в 14:06