Описание тега character-class

Классы символов - это конструкции регулярных выражений, которые определяют и соответствуют из списка мета- и литеральных символов. Используйте [regex-negation] для вопросов, связанных с дополнением классов символов в регулярном выражении.
2 ответа

Регулярное выражение Python, соответствующее полному или частичному слову

Есть ли способ, чтобы регулярное выражение соответствовало как можно большему количеству определенных слов? Например, если я ищу следующие слова: вчера, сегодня, завтра Я хочу извлечь следующие полные слова: Yest вчера пройдоха тода сегодня Том Tomo…
31 дек '15 в 04:55
2 ответа

Класс C++ regex не соответствует

Исходя из того, что я исследовал, выражение "[:alpha:]" будет соответствовать любому буквенному символу, но выражение соответствует только символу в нижнем регистре, а не в верхнем. Я не уверен, что с ним не так. std::regex e ("[:alpha:]"); if(std::…
09 июн '18 в 10:24
3 ответа

Как напечатать класс символов Perl?

Сегодня утром я проверял код и наткнулся на код, который был неправильным, но я не мог понять, почему. $line =~ /^[1-C]/; Эта строка должна была вычисляться до шестнадцатеричного символа между 1 а также C, но я предполагаю, что эта строка не делает …
30 апр '13 в 19:15
1 ответ

Вложенный класс символов регулярного выражения POSIX в Ruby?

Как вложить класс символов в стиле POSIX в другой класс символов? Я пытаюсь заменить совпадение пробела или тире: /[\s-]/ с /[[[:space:]]-]/ И это не работает. Я использую Ruby 1.9.3, а в официальном документе нет примеров вложения. Мне нужен стиль …
19 сен '14 в 16:48
1 ответ

Groovy Regex: Что делает тильда в классе персонажей?

У меня есть это регулярное выражение, которое выходит из отличного кода: (?:[^\p{Alnum}äöü**~D~V~\~_**]|^) (?:sometext|s\.t\.) (?:[^\p{Alnum}äöü**~D~V~\~_**]|$$) Единственное, что я не понимаю, это эта часть: **~D~V~\~_** Что там делает тильда? Это …
12 июл '12 в 14:57
1 ответ

Соответствие противоположности [[:blank:]] символьному классу в sed

Я не могу найти способ представить инверсию класса символов в sed. Если бы это была Perl-подобная среда, я бы использовал [^\s]. Однако в sed это выглядит как не-s, а не-пробел. В строке текста (из gdrive) мне нужно захватить первый токен без пробел…
10 фев '19 в 01:05
1 ответ

Python: класс символов POSIX в регулярных выражениях?

Как я могу найти, скажем, последовательность из 10 isprint символы в данной строке в Python? С GNU grep я бы просто сделал grep [[:print:]]{10}
10 авг '15 в 08:53
1 ответ

Почему [^\w] соответствует некоторым символам слова, но не [^\p{Word}]?

Я написал Perl-скрипт, который печатает символы, соответствующие свойству Unicode. Кажется, что до сих пор работает нормально для большинства свойств. Но это распечатывает ÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõöøùúûüýþ ÿ среди совпада…
04 авг '16 в 15:16
4 ответа

Регулярное выражение в алфавитном порядке с использованием обратных ссылок

Недавно я наткнулся на головоломку, чтобы найти регулярное выражение, которое соответствует: 5-символьные строки, состоящие из строчных букв английского алфавита в порядке возрастания ASCII Допустимые примеры: aaaaa abcde xxyyz ghost chips demos Нев…
30 июн '17 в 14:33
4 ответа

Как создать класс персонажей из следующего набора

+ - * / % < > = ! & ^ | ? : Я пробовал: [+-*/%<>=!&^|?:] Но я думаю, что некоторые из них должны быть отвергнуты. Как я могу сказать, какие из них?
29 апр '11 в 19:49
3 ответа

Как соответствовать Юникод гласные?

Какой символьный класс или свойство Unicode будет соответствовать любому гласному Unicode в Perl? Неправильный ответ: [aeiouAEIOU], ( проповедь здесь, пункт № 24 в списке прачечной) В perluniprops гласные упоминаются только для сценариев хангыль и и…
05 авг '16 в 15:24
1 ответ

php preg_match с использованием сокращенного и символьного класса в сочетании

echo preg_match( '/\d[A-Z]/', 'CD' ); // Displays “0” Как он может отображать 0, когда явно есть символы, которые соответствуют диапазону "[AZ]"? Так происходит разбор?
08 мар '13 в 13:01
1 ответ

Не-ASCII символы в регулярном выражении режима UTF-8

Вопрос Несмотря на руководство по PHP: "В режиме UTF-8 символы со значениями больше 128 не соответствуют ни одному из классов символов POSIX". Почему персидские цифры совпадают \d или же [[:digit:]] в "режиме UTF-8"? разработка В замечании ответчика…
06 июн '16 в 12:58
1 ответ

Повторное использование класса символов в регулярном выражении

Чтобы сделать регулярное выражение более кратким, существует ли сокращенный способ ссылки на класс символов, который встречается ранее в том же регулярном выражении? пример Есть ли способ сократить следующее: [acegikmoqstz@#&].*[acegikmoqstz@#&a…
20 ноя '13 в 23:33
1 ответ

Регулярное выражение - проблема с шаблоном [,-?[0-9]+]*

Это мой шаблон: ^~[0-9]+@Y 1,710,-?[0-9]+[,-?[0-9]+]*\n$ По какой-то причине это совпадает:~01@Y 1,710,9, Но нет: ~01@Y 1,710,9 Я не понимаю, зачем нужна последняя запятая? http://regex101.com/r/kP4pZ2/1
23 окт '14 в 06:09
1 ответ

Как переопределить, чтобы соответствовать подчеркиваниям?

Perl (\s для пробелов так же, как [\t\n\f\r ], Теперь, так как некоторые имена файлов используют подчеркивание в качестве пробелов, мне было интересно, можно ли переопределить \s (локально), чтобы соответствовать подчеркиваниям в дополнение к пробел…
13 июл '15 в 23:56
3 ответа

Почему "[" соответствует [a-zA-Z]

Regex oRegex = new Regex(@"test[a-zA-z]"); string st = @"this is a test1 and testA and test[abc] another testB and test(xyz) again."; foreach(Match match in oRegex.Matches(st)) { Console.WriteLine(match.Value); } Выход: панцирь тестовое задание[ tes…
15 июл '15 в 04:41
2 ответа

Как я могу перечислить членов класса символов регулярных выражений, таких как [:punct:]?

Например, я знаю из документации, такой как http://stat.ethz.ch/R-manual/R-devel/library/base/html/regex.html тот [:punct:] включает в себя ! " # $ % & ' ( ) * + , - . / : ; < = > ? @ [ \ ] ^ _ ` { | } ~. но я хотел бы проверить из командн…
21 мар '14 в 17:12
5 ответов

Почему этот шаблон не работает в egrep?

Почему я не могу сопоставить строку "1234567-1234567890" с заданным регулярным выражением \d{7}-\d{10} с egrep из скорлупы вот так: egrep \d{7}-\d{10} file ?
06 июл '10 в 10:36
3 ответа

Как вы используете символ плюс с классом символов как часть регулярного выражения?

В cygwin это не возвращает совпадение: $ echo "aaab" | grep '^[ab]+$' Но это возвращает совпадение: $ echo "aaab" | grep '^[ab][ab]*$' aaab Разве два выражения не идентичны? Есть ли способ выразить "один или несколько символов класса символов", не в…
13 апр '11 в 14:19