Как "обратное совпадение" с регулярным выражением?

Question

Как "обратное совпадение" с регулярным выражением?

Я использую RegexBuddy, но у меня все равно проблемы с этим:\

Я обрабатываю построчно файл. Я построил "линейную модель", чтобы соответствовать тому, что я хочу.

Теперь я хотел бы сделать обратное сопоставление... т.е. я хочу сопоставить строки, где есть строка из 6 букв, но только если эти шесть букв не являютсяАндреа, как мне это сделать?

РЕДАКТИРОВАТЬ: Я напишу программу, которая использует это регулярное выражение, я еще не знаю, если в Python или PHP, я делаю эту вещь сначала, чтобы выучить некоторое регулярное выражение:) Есть разные типы строк, я хотел бы использовать регулярное выражение чтобы выбрать интересующий меня тип. Как только я получу эти строки, я должен применить другой фильтр, просто чтобы не соответствовать известному значению, мне нужны все остальные, а не это. (?! Не хотел) работает довольно хорошо, спасибо.:-)

Я надеюсь, что это проясняет вопрос:)

166

regex inverse-match

Источник

user21384 02 окт '08 в 20:27

10 ответов

Решение

Для Python / Java,

^(.(?!(some text)))*$

http://www.lisnichenko.com/articles/javapython-inverse-regex.html

62

Источник

user232398 15 дек '09 в 19:57

Обновлено с обратной связью от Alan Moore

В PCRE и аналогичных вариантах вы можете создать регулярное выражение, соответствующее любой строке, не содержащей значения:

^(?:(?!Andrea).)*$

Это называется закаленным жадным жетоном. Недостатком является то, что он не работает хорошо.

45

Источник

user1188377 09 авг '16 в 09:06

Какой язык вы используете? Для этого важны возможности и синтаксис реализации регулярных выражений.

Вы могли бы использовать прогнозирование. Используя Python в качестве примера

import re

not_andrea = re.compile('(?!Andrea)\w{6}', re.IGNORECASE)

Чтобы сломать это:

(?! Андреа) означает "совпадать, если следующие 6 символов не являются" Андреа ""; если так то

\w означает "символ слова" - буквенно-цифровые символы. Это эквивалентно классу [a-zA-Z0-9_]

\w {6} означает ровно 6 символов слова.

re.IGNORECASE означает, что вы исключите "Андреа", "Андреа", "Андреа"...

Другой способ - использовать логику вашей программы - использовать все строки, не соответствующие Андреа, и ввести их через второе регулярное выражение, чтобы проверить наличие 6 символов. Или сначала проверьте по крайней мере 6 символов слова, а затем убедитесь, что он не соответствует Андреа.

13

Источник

user3189 02 окт '08 в 20:41

Отрицательное прогнозное утверждение

(?!Andrea)

Это не совсем перевернутое совпадение, но это лучшее, что вы можете напрямую сделать с помощью регулярных выражений. Не все платформы поддерживают их все же.

8

Источник

user5190 02 окт '08 в 20:32

Если вы хотите сделать это в RegexBuddy, есть два способа получить список всех строк, не соответствующих регулярному выражению.

На панели инструментов на панели "Тест" установите область тестирования "Строка за строкой". Когда вы это сделаете, элемент "Список всех строк без соответствий" появится под кнопкой "Список всех строк" на той же панели инструментов. (Если вы не видите кнопку "Список всех", нажмите кнопку "Совпадение" на главной панели инструментов.)

На панели GREP можно включить флажки "на основе строк" и "инвертировать результаты", чтобы получить список несоответствующих строк в файлах, через которые вы просматриваете.

6

Источник

user33358 31 дек '08 в 07:44

Я только что придумал этот метод, который может быть аппаратно интенсивным, но он работает:

Вы можете заменить все символы, которые соответствуют регулярному выражению, пустой строкой.

Это oneliner:

notMatched = re.sub(regex, "", string)

Я использовал это, потому что я был вынужден использовать очень сложное регулярное выражение и не мог понять, как инвертировать каждую его часть.

Это вернет вам только строковый результат, а не объекты соответствия!

5

Источник

user5111904 31 май '17 в 14:19

(?! полезно на практике. Хотя, строго говоря, взгляд в будущее не является регулярным выражением, как определено математически.

Вы можете написать обратное регулярное выражение вручную.

Вот программа для автоматического расчета результата. Его результат генерируется машиной, что обычно намного сложнее, чем ручная запись. Но результат работает.

5

Источник

user222893 28 ноя '14 в 16:12

Если у вас есть возможность сделать два совпадения регулярных выражений для обратного и соединить их вместе, вы можете использовать две группы захвата, чтобы сначала захватить все, прежде чем ваше регулярное выражение

^((?!yourRegex).)*

а затем зафиксируйте все, что находится за вашим регулярным выражением

(?<=yourRegex).*

Это работает для большинства регулярных выражений. Одна проблема, которую я обнаружил, заключалась в том, что в конце у меня был квантификатор вроде {2,4}. Тогда вам нужно проявить творческий подход.

4

Источник

user8567437 10 май '22 в 08:00

В Perl вы можете сделать

process($line) if ($line =~!/Andrea/);

-3

Источник

user12051 02 окт '08 в 20:56

Другие вопросы по тегам regex inverse-match

user17121 02 окт '08 в 20:28 2008-10-02 20:28 · Accepted Answer · 2008-10-02 20:28

(?!Andrea).{6}

Предполагая, что ваш движок регулярных выражений поддерживает негативные взгляды..

Редактировать: .. или, возможно, вы бы предпочли использовать [A-Za-z]{6} на месте .{6}

Edit (снова): обратите внимание, что lookaheads и lookbehinds, как правило, не являются правильным способом "инвертировать" совпадение регулярного выражения. Регулярные выражения на самом деле не настроены для выполнения отрицательного соответствия, они оставляют это на любом языке, с которым вы их используете.