Python3: конвертировать строку апостроф юникод
У меня есть строковое значение с апострофом, как это:
"I\\xE2\\x80\\x99m going now."
Как я могу получить правильное значение апострофа?
"I`m going now."
Как Вам известно, \xE2\x80\x99
это юникод символ U+2019 RIGHT SINGLE QUOTATION MARK
, но у меня есть строковое представление вместо байта...
1 ответ
Возможно, это то, что вы хотите:
utf8_apostrophe = b'\xe2\x80\x99'.decode("utf8")
str = "I"+utf8_apostrophe+"m going now"
В сторону: я столкнулся с этим при преобразовании одиночной кавычки в твите с кодировкой UTF-8 в обычную одинарную кавычку.
import re
original_tweet = 'I’m going now'
string_apostrophe = "'"
print re.sub(utf8_apostrophe, string_apostrophe, original_tweet)
который производит
I'm going now