Разделить строку на основе регулярного выражения

Question

Разделить строку на основе регулярного выражения

У меня есть вывод команды в табличной форме. Я анализирую этот вывод из файла результатов и сохраняю его в виде строки. Каждый элемент в одной строке разделен одним или несколькими пробельными символами, поэтому я использую регулярные выражения, чтобы сопоставить 1 или более пробелов и разделить их. Однако между каждым элементом вставляется пробел:

>>> str1="a    b     c      d" # spaces are irregular
>>> str1
'a    b     c      d'
>>> str2=re.split("( )+", str1)
>>> str2
['a', ' ', 'b', ' ', 'c', ' ', 'd'] # 1 space element between!!!

Есть лучший способ сделать это?

После каждого раскола str2 добавлен в список.

176

python regex

Источник

user2763554 11 июн '12 в 05:40

4 ответа

Решение

str.split Метод автоматически удалит все пробелы между элементами:

>>> str1 = "a    b     c      d"
>>> str1.split()
['a', 'b', 'c', 'd']

Документы находятся здесь: http://docs.python.org/library/stdtypes.html

27

Источник

user1339459 11 июн '12 в 05:44

Когда вы используете re.split и шаблон разделения содержит группы захвата, группы сохраняются в выходных данных. Если вы не хотите этого, используйте вместо этого группу без захвата.

8

Источник

user1427416 11 июн '12 в 05:43

Это очень просто на самом деле. Попробуй это:

str1="a    b     c      d"
splitStr1 = str1.split()
print splitStr1

2

Источник

user713495 11 июн '12 в 05:47

Другие вопросы по тегам python regex

user1219006 11 июн '12 в 05:44 2012-06-11 05:44 · Accepted Answer · 2012-06-11 05:44

Используя (,), вы захватываете группу, если вы просто удалите их, у вас не будет этой проблемы.

>>> str1 = "a    b     c      d"
>>> re.split(" +", str1)
['a', 'b', 'c', 'd']

Однако нет необходимости в регулярных выражениях, str.split без какого-либо указанного разделителя это разделит вас на пробелы. Это было бы лучшим способом в этом случае.

>>> str1.split()
['a', 'b', 'c', 'd']

Если вы действительно хотите регулярное выражение, вы можете использовать это ('\s' представляет пробел, и это более понятно):

>>> re.split("\s+", str1)
['a', 'b', 'c', 'd']

или вы можете найти все непробельные символы

>>> re.findall(r'\S+',str1)
['a', 'b', 'c', 'd']