Преобразование строки Unicode/UTF-8 в нижний / верхний регистр с использованием чистой и питонической библиотеки

Я использую Google App Engine и не могу использовать какое-либо расширение C/C++, просто библиотеку pure & pythonic для преобразования строк Unicode/UTF-8 в нижний / верхний регистр. str.lower() и string.lowercase() этого не делают.

1 ответ

Решение

str закодированы в UTF-8 и unicode два разных типа. Не использовать stringиспользуйте соответствующий метод для объекта Юникод:

>>> print u'ĉ'.upper()
Ĉ

раскодировать str в unicode Перед использованием:

>>> print 'ĉ'.decode('utf-8').upper()
Ĉ
Другие вопросы по тегам