Удаляет ли QRegularExpression обратные ссылки (и в результате ускоряет поиск)
Беглый взгляд на документацию по QRegexp
показывает, что он поддерживает обратные ссылки, в то время как QRegularExpression
не упоминает об этом. Это было бы примечательно, поскольку сопоставление регулярных выражений без обратных ссылок может масштабироваться за линейное время, в то время как обратные ссылки масштабируются как экспоненциальное время ( источник [мертвая ссылка], кэшированная версия).
В аналогичном ответе Stackru также упоминаются основные различия в скорости выполнения. Было бы логично предположить, что новый класс регулярных выражений может использовать новый алгоритм, который позволил бы ему выполнять поиск за линейное время, однако я не знаю об этом напрямую. Есть ли различия, похожие на вышеперечисленные в новом QRegularExpression
учебный класс?
1 ответ
QRegularExpression
отходит от функциональности QRegExp
в 5 конкретных областях:
- Поддержка для
\A
а также\z
- Поддержка глобального соответствия
- Удаление подстановочных знаков
- Удаление поддержки подчиненных синтаксисов регулярных выражений (теперь поддерживаются только Perl-совместимые регулярные выражения (PCRE))
- Добавлена поддержка
*?
а также+?
модификаторы - Удалена поддержка ненужного
QRegExp::CaretModes
за исключениемQRegExp::CaretAtOffset
Из этих изменений 4 очень актуально для этого вопроса. PCRE - безусловно самый продвинутый доступный механизм регулярных выражений. Так что он, безусловно, поддерживает обратные ссылки, а также многие другие функции QRegExp
никогда не мог стремиться.
Поскольку обоснование отсутствия явного упоминания всех функций, предоставляемых PCRE, связано с тем, что PCRE определяется документом из 70 тыс. Слов. Если вы хотите прожечь тонер-картридж, QRegularExpression
ссылки непосредственно на эту страницу: http://pcre.org/pcre.txt
Между прочим, приведенные цитаты из этого тома - это синтаксис обратной ссылки, поддерживаемый PCRE:
\n
ссылка по номеру (может быть неоднозначной)\gn
ссылка по номеру\g{n}
ссылка по номеру\g{-n}
относительная ссылка по номеру\k<name>
ссылка по имени (Perl)\k'name'
ссылка по имени (Perl)\g{name}
ссылка по имени (Perl)\k{name}
ссылка по имени (.NET)(?P=name)
ссылка по имени (Python)