Реализация "движка правил" в Python
Я пишу приложение для сбора / анализа журналов на Python, и мне нужно написать "движок правил", чтобы сопоставлять и обрабатывать сообщения журналов.
Это должно показать:
- Соответствие регулярному выражению для самого сообщения
- Арифметические сравнения для серьезности сообщения / приоритета
- Булевы операторы
Я предполагаю, что примерное правило, вероятно, будет примерно таким:
(message ~ "program\\[\d+\\]: message" and severity >= high) or (severity >= critical)
Я подумываю об использовании PyParsing или аналогичных программ для фактического разбора правил и построения дерева разбора.
Текущий (еще не реализованный) дизайн, который я имею в виду, состоит в том, чтобы иметь классы для каждого типа правила, а также создавать и связывать их вместе в соответствии с деревом разбора. Тогда каждое правило будет иметь метод "совпадения", который может принимать объект сообщения, возвращающий, соответствует ли он правилу.
Очень быстро, что-то вроде:
class RegexRule(Rule):
def __init__(self, regex):
self.regex = regex
def match(self, message):
return self.regex.match(message.contents)
class SeverityRule(Rule):
def __init__(self, operator, severity):
self.operator = operator
def match(self, message):
if operator == ">=":
return message.severity >= severity
# more conditions here...
class BooleanAndRule(Rule):
def __init__(self, rule1, rule2):
self.rule1 = rule1
self.rule2 = rule2
def match(self, message):
return self.rule1.match(message) and self.rule2.match(message)
Эти классы правил будут затем объединены в цепочку в соответствии с деревом разбора сообщения и методом match(), вызываемым в верхнем правиле, которое будет каскадно выполняться до тех пор, пока все правила не будут оценены.
Мне просто интересно, если это разумный подход, или мой дизайн и идеи совершенно не в порядке? К сожалению, у меня никогда не было возможности пройти курс разработки компилятора или чего-то подобного в Unviersity, поэтому я в значительной степени придумываю это самостоятельно.
Может ли кто-то с некоторым опытом в таких вещах, пожалуйста, присоединиться и оценить идею?
РЕДАКТИРОВАТЬ: Некоторые хорошие ответы до сих пор, вот немного пояснений.
Целью программы является сбор сообщений журнала с серверов в сети и сохранение их в базе данных. Помимо сбора сообщений журнала, сборщик определит набор правил, которые будут либо совпадать, либо игнорировать сообщения в зависимости от условий, и при необходимости помечать оповещение.
Я не вижу, чтобы правила были более чем средней сложности, и они будут применяться в цепочке (списке) до тех пор, пока не будет достигнуто соответствующее предупреждение или правило игнорирования. Однако эта часть не так актуальна для вопроса.
Что касается синтаксиса, близкого к синтаксису Python, то да, это правда, однако я думаю, что будет трудно отфильтровать Python до такой степени, что пользователь не сможет непреднамеренно сделать что-то сумасшедшее с правилами, которые не предназначены.
6 ответов
Не придумывайте еще один язык правил.
Либо используйте Python, либо используйте другой существующий, уже отлаженный и рабочий язык, например BPEL.
Просто напишите свои правила на Python, импортируйте их и выполните. Жизнь проще, намного легче отлаживать, и вы фактически решили реальную проблему чтения журнала, не создавая другой проблемы.
Представьте себе этот сценарий. Ваша программа ломается. Теперь это либо разбор правила, либо выполнение правила, либо само правило. Вы должны отладить все три. Если бы вы написали правило на Python, это было бы правилом, и это было бы так.
"Я думаю, что было бы трудно отфильтровать Python до такой степени, чтобы пользователь не мог непреднамеренно сделать что-то сумасшедшее с правилами, которые не были предназначены".
Это в значительной степени аргумент "Я хочу написать компилятор".
1) Вы основной пользователь. Вы будете писать, отлаживать и поддерживать правила. Есть ли действительно армии сумасшедших программистов, которые будут делать сумасшедшие вещи? В самом деле? Если есть потенциальный сумасшедший пользователь, поговорите с ним. Научить их. Не боритесь с ними, изобретая новый язык (который вам придется поддерживать и отлаживать вечно).
2) Это просто обработка логов. Там нет реальной стоимости сумасшествия. Никто не собирается разрушать мировую экономическую систему из-за неправильного обращения с бревнами. Не выполняйте небольшую задачу с несколькими десятками строк Python на интерпретаторе из 1000 строк, чтобы интерпретировать несколько десятков строк некоторого языка правил. Просто напишите несколько десятков строк Python.
Просто напишите это на Python так быстро и четко, как только можете, и переходите к следующему проекту.
Вы рассматривали NebriOS? Мы только что выпустили этот инструмент после создания его для наших собственных целей. Это чистый движок правил Python/Django. На самом деле мы используем его для задач рабочего процесса, но он достаточно универсален, чтобы помочь вам в вашей ситуации. Вам нужно будет подключиться к удаленной БД и запустить против нее правила.
Python, который вы написали, в конечном итоге станет более чем одним правилом в системе. Вот, например, один:
class SeverityRule(NebriOS):
# add listener or timer here
check(self):
if operator == ">="
return message.severity >= severity
# any number of checks here
action(self):
csv.append(message.severity, datetime.now)
send_email(kamil@example.com, """Severity level alert: {{message.severity}}""")
Проверьте это на http://nebrios.com/. Я не понимал, сколько нужно было создать приложение движка правил, такое как Nebri, до тех пор, пока моя команда не начала. Это была ОГРОМНАЯ задача, которая намного глубже, чем кажется. ACL, очереди, формы, KVPS, эффективные проверки, полезные ошибки, анализ электронной почты, динамические формы и список можно продолжить.
Единственное место, которое отличается от самого синтаксиса Python, это message ~ "program\\[\d+\\]: message"
часть, так что мне интересно, действительно ли вам нужен новый синтаксис.
Обновление: ОК, у вас есть проблемы с юзабилити или безопасностью - это разумно. Пара предложений:
Получите подсказку от Awk и упростите синтаксис сопоставления с образцом, например
/program\[\d+\]: message/
вместоmessage ~ "program\\[\d+\\]: message"
,Я бы реализовал это путем преобразования в выражение Python при разборе входных данных вместо создания дерева объектов для оценки, если только вы не собираетесь выполнять больше операций с этими вещами, чем вычислять. Это должно потребовать меньше кода и работать быстрее. Верхний уровень может выглядеть примерно так:
def compile(input): return eval('lambda message, severity: %s' % parse(input))
Еще одна идея, еще дальше: написать свое приложение на Lua. Он предназначен для непрограммистов, чтобы расширять программы достаточно безопасно без необходимости многому учиться. (Он успешно использовался таким образом, и вы можете тестировать в песочнице, чтобы пользовательский код не мог получить никаких возможностей, которые вы явно не передаете ему, мне сказали.)
Я замолчу сейчас.:-) Удачи!
Немного сложно ответить на вопрос, не зная, какова область применения.
- О чем вы пытаетесь рассуждать?
- О каком уровне анализа вы говорите?
- Насколько сложными вы видите становление правил?
- Насколько сложно взаимодействие между различными правилами?
На одном конце спектра простой однократный подход, как вы предложили. Это хорошо, если правил немного, относительно просто, и вы не делаете ничего более сложного, чем агрегирование сообщений журнала, соответствующих указанным правилам.
С другой стороны спектра находится система рассуждений с большим весом, что-то вроде CLIPS с интерфейсом Python. Это настоящий механизм правил с логическим выводом и предлагает возможность делать сложные рассуждения. Если вы создаете что-то вроде диагностического движка, который работает вне журнала программы, это может быть более подходящим.
РЕДАКТИРОВАТЬ:
Я бы сказал, что текущая идея реализации подходит для того, что вы делаете. Что-нибудь намного больше, и я думаю, что вы, вероятно, рискуете чрезмерно спроектировать решение. Похоже, что захватывает то, что вы хотите, сопоставляя в сообщениях журнала только на основе нескольких различных критериев.
Вы также можете взглянуть на pyDMNrules. Он строит механизмы правил из таблиц правил Decision Model Notation (DMN).