Доступ к символам скрипта урду
У меня есть следующая строка
test="ن گ ب ن د ی ک ر و ا ن "
я хочу получить доступ к каждому символу и сохранить его в некоторых переменных для последующего доступа, но когда я зациклился на них, я получил странный вывод. На самом деле я не очень осведомлен о схемах кодирования.
for i in test:
print(i)
Приведенный выше код дал мне некоторые странные символы, что я хочу, это оригинальные символы сценария?
2 ответа
Решение
Либо определить test
в качестве строки Unicode, или используйте decode
метод:
test="ن گ ب ن د ی ک ر و ا ن"
for i in test.decode('utf8'):
print(i)
# print unicode value
print(repr(i))
test=u"ن گ ب ن د ی ک ر و ا ن"
for i in test:
print(i)
# print unicode value
print(repr(i))
Очевидно, мой ответ касается Python 2.7.x.
Для Python 2.x попробуйте это:
test=u"ن گ ب ن د ی ک ر و ا ن "
for i in test:
print(i)
Прикрепление u
делает это unicode
объект.