Как заставить __repr__ возвращать строку в юникоде
Я называю __repr__()
функция на объекте x
следующее:
val = x.__repr__()
а потом я хочу хранить val
строка в SQLite
база данных. Проблема в том, что val
должен быть Unicode.
Я попробовал это безуспешно:
val = x.__repr__().encode("utf-8")
а также
val = unicode(x.__repr__())
Вы знаете, как это исправить?
я использую Python 2.7.2
4 ответа
repr(x).decode("utf-8")
а также unicode(repr(x), "utf-8")
должно сработать.
Представление объекта не должно быть Unicode. Определите __unicode__
метод и передать объект unicode()
,
В Python2 вы можете определить два метода:
#!/usr/bin/env python
# coding: utf-8
class Person(object):
def __init__(self, name):
self.name = name
def __unicode__(self):
return u"Person info <name={0}>".format(self.name)
def __repr__(self):
return self.__unicode__().encode('utf-8')
if __name__ == '__main__':
A = Person(u"皮特")
print A
В Python3 просто определите __repr__
будет в порядке:
#!/usr/bin/env python
# coding: utf-8
class Person(object):
def __init__(self, name):
self.name = name
def __repr__(self):
return u"Person info <name={0}>".format(self.name)
if __name__ == '__main__':
A = Person(u"皮特")
print(A)
У меня была похожая проблема, потому что я вытаскивал текст из списка, используя repr.
b =['text\xe2\x84\xa2', 'text2'] ## \xe2\x84\xa2 is the TM symbol
a = repr(b[0])
c = unicode(a, "utf-8")
print c
>>>
'text\xe2\x84\xa2'
Я наконец попытался присоединиться, чтобы вывести текст из списка.
b =['text\xe2\x84\xa2', 'text2'] ## \xe2\x84\xa2 is the TM symbol
a = ''.join(b[0])
c = unicode(a, "utf-8")
print c
>>>
text™
Теперь это работает!!!!
Я пробовал несколько разных способов. Каждый раз, когда я использовал repr с функцией unicode, это не работало. Я должен использовать соединение или объявить текст, как в переменной е ниже.
b =['text\xe2\x84\xa2', 'text2'] ## \xe2\x84\xa2 is the TM symbol
a = ''.join(b[0])
c = unicode(repr(a), "utf-8")
d = repr(a).decode("utf-8")
e = "text\xe2\x84\xa2"
f = unicode(e, "utf-8")
g = unicode(repr(e), "utf-8")
h = repr(e).decode("utf-8")
i = unicode(a, "utf-8")
j = unicode(''.join(e), "utf-8")
print c
print d
print e
print f
print g
print h
print i
print j
*** Remote Interpreter Reinitialized ***
>>>
'text\xe2\x84\xa2'
'text\xe2\x84\xa2'
textâ„¢
text™
'text\xe2\x84\xa2'
'text\xe2\x84\xa2'
text™
text™
>>>
Надеюсь это поможет.