Преобразование строки Unicode/UTF-8 в нижний / верхний регистр с использованием чистой и питонической библиотеки
Я использую Google App Engine и не могу использовать какое-либо расширение C/C++, просто библиотеку pure & pythonic для преобразования строк Unicode/UTF-8 в нижний / верхний регистр. str.lower() и string.lowercase() этого не делают.
1 ответ
Решение
str
закодированы в UTF-8 и unicode
два разных типа. Не использовать string
используйте соответствующий метод для объекта Юникод:
>>> print u'ĉ'.upper()
Ĉ
раскодировать str
в unicode
Перед использованием:
>>> print 'ĉ'.decode('utf-8').upper()
Ĉ