Описание тега unicode-literals

Используйте этот тег для вопросов, связанных с литералами Unicode. Пример: ( u'some text'), который представляет собой объект, отличный от байтовой строки ( 'some text').
2 ответа

Java: как конвертировать UTF-8 (в буквальном смысле) в Unicode

У меня UTF-8(в буквальном смысле), как это "\xE2\x80\x93." Я пытаюсь преобразовать это в Unicode, используя Java. Но я не смог найти способ преобразовать это. Может ли кто-нибудь помочь мне в этом? С уважением, сб
23 июн '13 в 16:00
2 ответа

Строковые литералы Python Unicode:: В чем разница между '\u0391' и u'\u0391'

Я использую Python 2.7.3. Кто-нибудь может объяснить разницу между литералами: '\u0391' а также: u'\u0391' и другой способ, которым они отражены в REPL ниже (особенно дополнительная косая черта, добавленная к a1): >>> a1='\u0391' >>&g…
28 янв '13 в 09:55
1 ответ

UnicodeEncodeError при форматировании u'ES SIOUF_1'в Python 2

У меня есть этот код: "'{}'".format(u'ES SIOUF_1') При запуске в Python 2 я получаю следующую ошибку: Traceback (most recent call last): File "<interactive input>", line 1, in <module> UnicodeEncodeError: 'ascii' codec can't encode chara…
2 ответа

Подпроцесс Python отображает литерал Юникода

Я знаю, что такие вопросы задавались раньше. Но я не нахожу решения. Я хочу использовать литерал Unicode, определенный в моем файле Python, с модулем подпроцесса. Но я не получаю результаты, которые мне нужны. Например, следующий код # -*- coding: u…
05 май '15 в 13:57
0 ответов

Настройте SQL Server для использования литералов Unicode по умолчанию

Мы переносим классическое приложение ASP с использованием SQL Server на мультиязычность, и для этого в качестве первого шага мы должны перейти с кодировки ansi / windows-1252 на Unicode. Мы успешно переместили программы ASP (сохранив затем в UTF-8 с…
1 ответ

Получение вывода на консоль win при вызове исключения, содержащего литерал unicode (u"\u0410")

Я столкнулся с неясной проблемой, когда поднятое исключение Python было напечатано на консоли win. Когда сообщение об исключении содержит какой-либо юникодный литерал, оно вообще не печатается или печатается неправильно. Консольная кодировка cp866 К…
2 ответа

Как вы можете безопасно объявить 16-битный строковый литерал в C?

Я знаю, что уже есть стандартный метод с префиксом L: wchar_t *test_literal = L"Test"; Проблема в том, что wchar_t не гарантируется, что он будет 16-битным, но для моего проекта мне нужен 16-битный wchar_t, Я также хотел бы избежать требования прохо…
4 ответа

Считайте эмодзи одним персонажем в регулярном выражении

Вот небольшой пример: reg = ur"((?P<initial>[+\-])(?P<rest>.+?))$" (В обоих случаях файл имеет -*- coding: utf-8 -*-) В Python 2: re.match(reg, u"hello").groupdict() # => {u'initial': u'\ud83d', u'rest': u'\udc4dhello'} # unicode why …
5 ответов

Как добавить Unicode литерал в переменную?

Я видел несколько примеров, подобных этому: for name in os.listdir(u'somedir') : моя проблема в том, что я получаю somedir как переменную, так как я могу добавить литерал 'u'? что-то вроде for name in ops.listdir(u+somedir) ?
09 авг '12 в 17:51
1 ответ

Указание кодировки литерала Unicode для каждого литерала

Согласно документации, можно определить кодировку литералов, используемых в источнике Python, следующим образом: # -*- coding: latin-1 -*- u = u'abcdé' # This is a unicode string encoded in latin-1 Есть ли поддержка синтаксиса для определения кодиро…
17 окт '13 в 07:11
1 ответ

Заменить все литералы Юникода в строке соответствующим символом

У меня есть стандартная строка Python3, содержащая несколько литералов Unicode (например, "\u00c6")Мне нужно превратить их обратно в соответствующие им символы (Скандинавские буквы: æ, ø, å) Я попытался погуглить его и используя .encode() а также .d…
3 ответа

Unicode буквенная строка

Я посылаю некоторые JSON в запрос HTTP пост. часть текста внутри объекта json должна иметь верхние индексы. если я создаю свою строку в C# как: string s = "here is my superscript: \u00B9"; он преобразует \u00B9 в фактический верхний индекс 1, что на…
24 июн '13 в 16:34
1 ответ

Регулярные выражения и литералы Юникода

Я хотел бы удалить некоторые символы из строки (байтовой строки или строки Юникода) с помощью регулярного выражения, например: pattern = re.compile(ur'\u00AE|\u2122', re.UNICODE) Если символы указаны как литералы Юникода, результирующее регулярное в…
23 ноя '11 в 16:08
0 ответов

Удаление общих слов в питоне

Как удалить общие слова из двух документов, извлеченных из двух сайтов? Я уже извлек новость с двух сайтов, теперь я хочу удалить общие слова из двух документов. Я использовал следующий код для извлечения новостей с двух разных сайтов: from __future…
14 мар '17 в 16:14
0 ответов

Как я могу preg_replace буквальный синтаксис Unicode?

У меня есть большой набор данных, который был преобразован из данных JSON. Он содержит символы Юникода с использованием JSON-совместимой нотации \uXXXX. Я пытаюсь преобразовать их в настоящий Unicode на лету, используя preg_replace. preg_replace('/\…
23 июн '17 в 10:54
1 ответ

Как использовать литералы Unicode с ключом командной строки Node.js -e "оценивать скрипт"

Node.js имеет -e переключатель командной строки для оценки кода, предоставленного в командной строке, а не в отдельном файле сценария. Как ни странно, я не могу найти официальную документацию для него в Интернете, но исполняемый файл узла самодокуме…
1 ответ

Маркировка текста символами Юникода

Я использую markjs ( https://markjs.io/) в своем проекте. Это в основном используется для выделения текста. Он работает хорошо, за исключением некоторого текста с символами Юникода в нем. Например, текст с символами "\xA0" Вот ссылка на jsfiddle для…
07 мар '17 в 13:42
1 ответ

Как правильно использовать `__attribute__((format (printf, x, y)))` для C11 U"литералы юникода"?

Я портирую приложение с помощью char* для всего и повсюду, чтобы использовать UCS4 в качестве внутреннего представления Unicode. Я использую С11 U"unicode literals" для определения строк, которые расширяются до массивов char32_t, которые uint32_t по…
04 ноя '14 в 18:46
2 ответа

Как мне преобразовать строку "\u{0026}" в "&" в Swift?

У меня есть строка, которая может содержать символы Юникода в форме "\u{0026}", и я хочу, чтобы она была преобразована в соответствующий символ "&". Как я могу это сделать? let input = "\\u{0026} something else here" let expectedOutput = "& some…
21 дек '16 в 09:23
2 ответа

Как обеспечить, чтобы все строковые литералы были в кодировке Unicode в Python

У меня есть довольно большая база кода Python, чтобы пройти. Есть проблема, когда некоторые строковые литералы являются строками, а другие - юникодом. И это вызывает ошибки. Я пытаюсь преобразовать все в Unicode. Мне было интересно, если есть инстру…
16 мар '13 в 14:06