Регулярное выражение для разрешения пробелов между словами

Question

Регулярное выражение для разрешения пробелов между словами

Я хочу регулярное выражение, которое запрещает символы и позволяет только буквы и цифры. Это регулярное выражение прекрасно работает, но не допускает пробелов между словами.

^[a-zA-Z0-9_]*$

Например, при использовании этого регулярного выражения "HelloWorld" нормально, но "Hello World" не совпадает.

Как я могу настроить его, чтобы оставить пробелы?

281

regex space alphanumeric

Источник

user1029608 18 мар '13 в 08:52

19 ответов

Решение

Одной из возможностей было бы просто добавить пробел в ваш класс символов, как предположил acheong87, это зависит от того, насколько вы строги в своем шаблоне, потому что это также позволило бы строку, начинающуюся с 5 пробелов, или строки, состоящие только из пробелов.

Другая возможность - определить шаблон:

я использую \w это в большинстве вкусов регулярных выражений так же, как [a-zA-Z0-9_] (в некоторых это основано на Unicode)

^\w+( \w+)*$

Это позволит серии не менее одного слова и слова разделены пробелами.

^ Сопоставить начало строки

\w+ Совпадение серии, состоящей как минимум из одного слова

( \w+)* группа, которая повторяется 0 или более раз. В группе ожидается пробел, за которым следует серия из не менее чем одного слова

$ соответствует концу строки

166

Источник

user626273 18 мар '13 в 09:46

Этот работал для меня

([\w ]+)

42

Источник

user2348154 13 янв '14 в 22:48

Попробуйте с:

^(\w+ ?)*$

Объяснение:

\w             - alias for [a-zA-Z_0-9]
"whitespace"?  - allow whitespace after word, set is as optional

15

Источник

user223386 18 мар '13 в 08:55

Я предполагаю, что вы не хотите, чтобы ведущий / конечный пробел. Это означает, что вы должны разделить регулярное выражение на "первый символ", "материал посередине" и "последний символ":

^([a-zA-Z0-9_][a-zA-Z0-9_ ]*[a-zA-Z0-9_]$

или если вы используете Perl-подобный синтаксис:

^\w[\w ]*\w$

Также: если вы намеренно сформулировали свое регулярное выражение, что оно также допускает пустые строки, вы должны сделать все это необязательным:

^(\w[\w ]*\w)?$

Если вы хотите разрешить использование только одного пробела, это выглядит немного иначе:

^((\w+ )*\w+)?$

Это соответствует 0..n словам, за которыми следует один пробел, плюс одно слово без пробела. И делает все это необязательным, чтобы разрешить пустые строки.

13

Источник

user1814922 18 мар '13 в 09:01

Это регулярное выражение

^\w+(\s\w+)*$

будет позволять только один пробел между словами и без начальных или конечных пробелов.

Ниже приведено объяснение регулярного выражения:

^ Утвердить позицию в начале строки
\w+ Подберите любой символ слова [a-zA-Z0-9_]
1. Квантор: + От одного до неограниченного количества раз, столько раз, сколько возможно, отдача по мере необходимости [жадный]
1-я группа захвата (\s\w+)*
1. Квантор: * От нуля до неограниченного количества раз, столько раз, сколько возможно, отдача по мере необходимости [жадный]
2. \s Подберите любой символ пробела [\r\n\t\f ]
3. \w+ Подберите любой символ слова [a-zA-Z0-9_]
  1. Квантор: + От одного до неограниченного количества раз, столько раз, сколько возможно, отдача по мере необходимости [жадный]
$ Утвердить позицию в конце строки

6

Источник

user1698964 23 май '16 в 23:36

Просто добавьте пробел в конец шаблона регулярного выражения следующим образом:

[a-zA-Z0-9_ ]

6

Источник

user3956731 20 сен '18 в 12:19

Это не позволяет места в начале. Но позволяет пробелы между словами. Также учитывает специальные символы между словами. Хорошее регулярное выражение для полей FirstName и LastName.

\w+.*$

3

Источник

user475882 18 сен '13 в 14:48

Это регулярное выражение допускает только алфавит и пробелы:

      ^[a-zA-Z ]*$

3

Источник

user5853235 19 июн '22 в 11:04

Только для алфавитов:

^([a-zA-Z])+(\s)+[a-zA-Z]+$

Для буквенно-цифрового значения и _:

^(\w)+(\s)+\w+$

2

Источник

user4860939 25 авг '16 в 12:05

если вы используете javascript, вы можете использовать это регулярное выражение:

      /^[a-z0-9_.-\s]+$/i

Например:

      /^[a-z0-9_.-\s]+$/i.test("") //false
/^[a-z0-9_.-\s]+$/i.test("helloworld") //true
/^[a-z0-9_.-\s]+$/i.test("hello world") //true
/^[a-z0-9_.-\s]+$/i.test("none alpha: ɹqɯ") //false

Единственным недостатком этого регулярного выражения является строка, полностью состоящая из пробелов, "" также будет отображаться как истина.

2

Источник

user5586440 29 апр '21 в 23:03

Это было мое регулярное выражение: @"^(?=.{3,15}$)(?:(?:\p{L}|\p{N})[._()\[\]-]?)*$"

Я только что добавил ([\w ]+) в конце моего регулярного выражения до *

@"^(?=.{3,15}$)(?:(?:\p{L}|\p{N})[._()\[\]-]?)([\w ]+)*$"

Теперь в строке разрешено иметь пробелы.

1

Источник

user1402749 15 сен '20 в 06:47

Все вышеперечисленные коды не работают, когда пользователь включает символ клавиатуры. Итак, вот регкс, когда пользователю разрешено добавлять любой символ или слово, но они могут ставить пробелы между словами. Попробуйте это.

 ^[^ ]+( [^ ]+)*$

0

Источник

user5148738 17 фев '17 в 09:18

Хорошо посмотрел на многие из этих предполагаемых ответов...

... и bupkis после очистки Stack Overflow, а также других сайтов для регулярного выражения, которое соответствует любой строке без начального или конечного пробела и только с одним пробелом между строго символьными словами.

^[a-zA-Z]+[(?<=\d\s]([a-zA-Z]+\s)*[a-zA-Z]+$

Таким образом, легко изменить буквенно-цифровой:

^[a-zA-Z0-9]+[(?<=\d\s]([a-zA-Z0-9]+\s)*[a-zA-Z0-9]+$

(Это не соответствует отдельным словам, а просто использовать переключатель /if-else с простым ^[a-zA-Z0-9]+$ если вам нужно поймать отдельные слова в дополнение.)

наслаждайся:D

-1

Источник

user2397606 25 июл '15 в 01:38

Попробуйте с этим:

result = re.search(r"\w+( )\w+", text)

-1

Источник

user2328851 21 сен '20 в 08:13

Если пробелы не обязательны, вы можете сопоставить:

string1 = 'hello_World'

или же

string2 = 'hello world'

от

pattern = '[\w\s]+'

-1

Источник

user2239760 24 апр '19 в 12:51

Я считаю, что это хорошо работает для "FullName":

([a-z',.-]+( [a-z',.-]+)*){1,70}/

-1

Источник

user1138620 25 сен '16 в 14:08

Попробуйте это: (версия Python)

"(A-Za-z0-9 ){2, 25}"

изменить верхний предел на основе вашего набора данных

-1

Источник

user5803230 04 сен '16 в 02:57

Пытаться.*? чтобы пустые места это работало на меня

-4

Источник

user4035152 12 сен '14 в 14:12

Другие вопросы по тегам regex space alphanumeric

user925913 18 мар '13 в 08:54 2013-03-18 08:54 · Accepted Answer · 2013-03-18 08:54

ТЛ; др

Просто добавьте пробел в свой класс персонажа.

^[a-zA-Z0-9_ ]*$

Теперь, если вы хотите быть строгим...

Выше не совсем правильно. Благодаря тому факту, что * означает ноль или более, это будет соответствовать всем следующим случаям, которые обычно не будут соответствовать:

Пустая строка "".
Строка, состоящая полностью из пробелов, "".
Строка, которая приводит и / или тянется с пробелами " Hello World ".
Строка, содержащая несколько пробелов между словами " Hello World ".

Первоначально я не думал, что такие детали заслуживают того, чтобы их вдаваться, поскольку ОП задавал такой простой вопрос, что строгость не была проблемой. Теперь, когда вопрос приобрел некоторую популярность, я хочу сказать...

... используйте ответ @stema.

Который, в моем вкусе (без использования \w) переводится как:

^[a-zA-Z0-9_]+( [a-zA-Z0-9_]+)*$

(Пожалуйста, upvote @stema независимо.)

Несколько замечаний по поводу этого (и @stema's) ответа:

Если вы хотите разрешить использование нескольких пробелов между словами (например, если вы хотите разрешить случайные двойные пробелы или если вы работаете с текстом, вставленным в копию из PDF), то добавьте + после пробела:
```
^\w+( +\w+)*$
```
Если вы хотите разрешить вкладки и символы новой строки (пробельные символы), замените пробел на \s+:
```
^\w+(\s+\w+)*$
```
Здесь я предлагаю + по умолчанию, потому что, например, разрывы строк Windows состоят из двух пробельных символов в последовательности, \r\n так что вам понадобится + чтобы поймать оба.

До сих пор не работает?

Проверьте, какой диалект регулярных выражений вы используете. ^* В таких языках, как Java, вам придется избегать обратной косой черты, т.е. \\w а также \\s, В старых или более базовых языках и утилитах, таких как sed, \w а также \s не определены, поэтому запишите их с классами символов, например [a-zA-Z0-9_] а также [\f\n\p\r\t] соответственно.

^{^* Я знаю, что этот вопрос помечен vb.net, но, исходя из 25 000 просмотров, я предполагаю, что не только те люди, которые сталкиваются с этим вопросом.} ^{В настоящее время это первое попадание в Google по поисковой фразе, слову регулярного выражения.}