Доступ к символам скрипта урду

У меня есть следующая строка

test="ن گ ب ن د ی ک ر و ا ن "

я хочу получить доступ к каждому символу и сохранить его в некоторых переменных для последующего доступа, но когда я зациклился на них, я получил странный вывод. На самом деле я не очень осведомлен о схемах кодирования.

for i in test:
    print(i)

Приведенный выше код дал мне некоторые странные символы, что я хочу, это оригинальные символы сценария?

2 ответа

Решение

Либо определить test в качестве строки Unicode, или используйте decode метод:

test="ن گ ب ن د ی ک ر و ا ن"
for i in test.decode('utf8'):
    print(i)
    # print unicode value
    print(repr(i))

test=u"ن گ ب ن د ی ک ر و ا ن"
for i in test:
    print(i)
    # print unicode value
    print(repr(i))

Очевидно, мой ответ касается Python 2.7.x.

Для Python 2.x попробуйте это:

test=u"ن گ ب ن د ی ک ر و ا ن "
for i in test:
    print(i)

Прикрепление u делает это unicode объект.

Другие вопросы по тегам