Замена без учета регистра
Какой самый простой способ сделать замену строк без учета регистра в Python?
11 ответов
string
Тип не поддерживает это. Возможно, вам лучше всего использовать метод sub регулярного выражения с параметром re.IGNORECASE.
>>> import re
>>> insensitive_hippo = re.compile(re.escape('hippo'), re.IGNORECASE)
>>> insensitive_hippo.sub('giraffe', 'I want a hIPpo for my birthday')
'I want a giraffe for my birthday'
import re
pattern = re.compile("hello", re.IGNORECASE)
pattern.sub("bye", "hello HeLLo HELLO")
# 'bye bye bye'
В одной строке:
import re
re.sub("(?i)hello","bye", "hello HeLLo HELLO") #'bye bye bye'
re.sub("(?i)he\.llo","bye", "he.llo He.LLo HE.LLO") #'bye bye bye'
Или используйте необязательный аргумент "flags":
import re
re.sub("hello", "bye", "hello HeLLo HELLO", flags=re.I) #'bye bye bye'
re.sub("he\.llo", "bye", "he.llo He.LLo HE.LLO", flags=re.I) #'bye bye bye'
Продолжая ответ bFloch, эта функция изменит не одно, а все вхождения старого на новое - без учета регистра.
def ireplace(old, new, text):
idx = 0
while idx < len(text):
index_l = text.lower().find(old.lower(), idx)
if index_l == -1:
return text
text = text[:index_l] + new + text[index_l + len(old):]
idx = index_l + len(new)
return text
Как говорит Блэр Конрад, string.replace не поддерживает это.
Используйте регулярное выражение re.sub
, но не забудьте сначала экранировать строку замены. Обратите внимание, что в 2.6 нет опции flags для re.sub
, так что вам придется использовать встроенный модификатор '(?i)'
(или RE-объект, см. ответ Блэр Конрад). Кроме того, другая ловушка заключается в том, что sub будет обрабатывать экранирование обратной косой черты в тексте замены, если задана строка. Чтобы избежать этого, можно вместо этого перейти в лямбду.
Вот функция:
import re
def ireplace(old, repl, text):
return re.sub('(?i)'+re.escape(old), lambda m: repl, text)
>>> ireplace('hippo?', 'giraffe!?', 'You want a hiPPO?')
'You want a giraffe!?'
>>> ireplace(r'[binfolder]', r'C:\Temp\bin', r'[BinFolder]\test.exe')
'C:\\Temp\\bin\\test.exe'
Эта функция использует как str.replace()
а также re.findall()
функции. Это заменит все случаи pattern
в string
с repl
без учета регистра.
def replace_all(pattern, repl, string) -> str:
occurences = re.findall(pattern, string, re.IGNORECASE)
for occurence in occurences:
string = string.replace(occurence, repl)
return string
Это не требует RegularExp
def ireplace(old, new, text):
"""
Replace case insensitive
Raises ValueError if string not found
"""
index_l = text.lower().index(old.lower())
return text[:index_l] + new + text[index_l + len(old):]
Интересное наблюдение о деталях и опциях синтаксиса:
Python 3.7.2 (tags / v3.7.2:9a3ffc0492, 23 декабря 2018 г., 23:09:28) [MSC v.1916 64 бит (AMD64)] на win32
import re
old = "TREEROOT treeroot TREerOot"
re.sub(r'(?i)treeroot', 'grassroot', old)
'низовой низовой низовой'
re.sub(r'treeroot', 'grassroot', old)
'TREEROOT массовый TREerOot'
re.sub(r'treeroot', 'grassroot', old, flags=re.I)
'низовой низовой низовой'
re.sub(r'treeroot', 'grassroot', old, re.I)
'TREEROOT массовый TREerOot'
Таким образом, префикс (? I) в выражении соответствия или добавление "flags=re.I" в качестве четвертого аргумента приведет к совпадению без учета регистра. НО, использование только "re.I" в качестве четвертого аргумента не приводит к совпадению без учета регистра.
Для сравнения,
re.findall(r'treeroot', old, re.I)
['TREEROOT', 'treeroot', 'TREerOot']
re.findall(r'treeroot', old)
['treeroot']
Простое решение в 1 строку без импорта :-)
words = 'GREETINGS from EGYPT. GreeTings from Cairo'
replace_what, replace_with, = 'Greetings', 'Hello'
result = ' '.join([replace_with if word.lower() == replace_what.lower() else word for word in words.split(' ')])
print (result)
Результат:
Hello from EGYPT. Hello from Cairo
У меня было \t преобразование в escape-последовательности (прокрутка немного вниз), поэтому я заметил, что re.sub конвертирует экранированные символы с обратной косой чертой в escape-последовательности.
Чтобы предотвратить это, я написал следующее:
Заменить без учета регистра.
import re
def ireplace(findtxt, replacetxt, data):
return replacetxt.join( re.compile(findtxt, flags=re.I).split(data) )
Кроме того, если вы хотите заменить его на escape-символы, как и в других ответах, которые получают специальные символы bashslash, преобразованные в escape-последовательности, просто декодируйте строку find и или заменяйте строку. В Python 3 может понадобиться что-то вроде.decode("unicode_escape") # python3
findtxt = findtxt.decode('string_escape') # python2
replacetxt = replacetxt.decode('string_escape') # python2
data = ireplace(findtxt, replacetxt, data)
Протестировано в Python 2.7.8
Надеюсь, это поможет.
Я никогда не публиковал ответ, и эта ветка действительно старая, но я придумал другое решение и решил, что могу получить ваш отклик. Я не опытный программист на Python, поэтому, если у него есть явные недостатки, пожалуйста, укажите на них, поскольку он хорошо изучен:)
i='I want a hIPpo for my birthday'
key='hippo'
swp='giraffe'
o=(i.lower().split(key))
c=0
p=0
for w in o:
o[c]=i[p:p+len(w)]
p=p+len(key+w)
c+=1
print(swp.join(o))