Как сопоставить только те числа, которые имеют четное число `%` предшествующих им?

Я хочу поймать числа, появляющиеся в любом месте строки, и заменить их на "(.+)".

Но я хочу поймать только те числа, которые имеют четное число %с ними. Не беспокойтесь, если какие-либо окружающие символы будут схвачены: мы можем использовать группы захвата, чтобы отфильтровать числа.

Я не могу придумать регулярное выражение ECMAscript.

Вот детская площадка:

abcd %1 %%2 %%%3 %%%%4 efgh

abcd%12%%34%%%666%%%%11efgh

Удачный улов будет вести себя так:
желаемое поведение


Вещи, которые я пробовал:

попытка 1

попытка 2

попытка 3


Если вы поняли, третья попытка почти работает. Единственные проблемы во второй линии детской площадки. На самом деле, что я хотел сказать в этом выражении:

Совпадение числа, если ему предшествует четное число %s И верно одно из следующих условий:

  • Вышеупомянутому целому выражению не предшествует ничего (отсутствие (неиспользованного или иного) характера].
  • Выше целому выражению предшествует символ, отличный от %,

Есть ли способ сопоставить отсутствие персонажа?
Это то, что я пытался сделать с помощью \0 в третьей попытке.

3 ответа

Решение

Ты можешь использовать (?:[^%\d]|^|\b(?=%))(?:%%)*(\d+) как шаблон, где ваш номер хранится в первой группе захвата. Это также относится к числам, которым предшествуют ноль%-символов.

Это будет соответствовать четному количеству%-знаков, если им предшествует:

  • ни%, ни число (поэтому нам не нужно перехватывать последнее число перед%, так как это не будет работать с такими цепочками, как %%1%%2)
  • начало строки
  • граница слова (то есть любой символ слова) для цепей, упомянутых выше

Вы можете увидеть это в действии здесь

вопрос

Вы хотите регулярное выражение с отрицательным взглядом бесконечной ширины:

(?<=(^|[^%])(?:%%)*)\d+

Вот демоверсия.NET regex

В ES7 это не поддерживается, вам нужно использовать языковые средства и упрощенное регулярное выражение, чтобы соответствовать любому числу % перед последовательностью цифр: /(%*)(\d+)/g а затем проверьте внутри replace Обратный вызов, если количество процентных знаков является четным или нет, и действовать соответствующим образом.

JavaScript

Вместо того, чтобы пытаться эмулировать внешний вид переменной ширины, вы можете просто использовать средства JS:

var re = /(%*)(\d+)/g;          // Capture into Group 1 zero or more percentage signs
var str = 'abcd %1 %%2 %%%3 %%%%4 efgh<br/><br/>abcd%12%%34%%%666%%%%11efgh';
var res = str.replace(re, function(m, g1, g2) { // Use a callback inside replace
  return (g1.length % 2 === 0) ? g1 + '(.+)' : m; // If the length of the %s is even
});                             // Return Group 1 + (.+), else return the whole match
document.body.innerHTML = res;

Если должно быть хотя бы 2 % перед цифрами используйте /(%+)(\d+)/g шаблон регулярных выражений, где %+ соответствует как минимум 1 (или более) процентным знакам.

Преобразование в C++

Тот же алгоритм может быть использован в C++. Единственная проблема заключается в том, что нет встроенной поддержки метода обратного вызова внутри std::regex_replace, Его можно добавить вручную и использовать так:

#include <iostream>
#include <cstdlib>
#include <string>
#include <regex>
using namespace std;

template<class BidirIt, class Traits, class CharT, class UnaryFunction>
std::basic_string<CharT> regex_replace(BidirIt first, BidirIt last,
    const std::basic_regex<CharT,Traits>& re, UnaryFunction f)
{
    std::basic_string<CharT> s;

    typename std::match_results<BidirIt>::difference_type
        positionOfLastMatch = 0;
    auto endOfLastMatch = first;

    auto callback = [&](const std::match_results<BidirIt>& match)
    {
        auto positionOfThisMatch = match.position(0);
        auto diff = positionOfThisMatch - positionOfLastMatch;

        auto startOfThisMatch = endOfLastMatch;
        std::advance(startOfThisMatch, diff);

        s.append(endOfLastMatch, startOfThisMatch);
        s.append(f(match));

        auto lengthOfMatch = match.length(0);

        positionOfLastMatch = positionOfThisMatch + lengthOfMatch;

        endOfLastMatch = startOfThisMatch;
        std::advance(endOfLastMatch, lengthOfMatch);
    };

    std::sregex_iterator begin(first, last, re), end;
    std::for_each(begin, end, callback);

    s.append(endOfLastMatch, last);

    return s;
}

template<class Traits, class CharT, class UnaryFunction>
std::string regex_replace(const std::string& s,
    const std::basic_regex<CharT,Traits>& re, UnaryFunction f)
{
    return regex_replace(s.cbegin(), s.cend(), re, f);
}

std::string my_callback(const std::smatch& m) {
  if (m.str(1).length() % 2 == 0) {
    return m.str(1) + "(.+)";
  } else {
    return m.str(0);
  }
}

int main() {
    std::string s = "abcd %1 %%2 %%%3 %%%%4 efgh\n\nabcd%12%%34%%%666%%%%11efgh";
    cout << regex_replace(s, regex("(%*)(\\d+)"), my_callback) << endl;

    return 0;
}

Смотрите демоверсию IDEONE.

Отдельное спасибо за код обратного звонка Джону Мартину.

Я не знаю ECMAScript, но следующая документация имеет ответ:

ECMAScript регулярное выражение

Поиск негативного взгляда, который приведет к чему-то вроде этого:

(?!%)(([%]{2})*\d+)

...где (?!%) значит не предшествует % буквальный.

Другие вопросы по тегам