В регулярном выражении парсинга сумо логики, как я могу разрешить и выбросить шаблоны?

Рассмотрим журнал доступа к REST API, вы увидите строки (упрощенно), которые выглядят так:

2017-01-01T12:12:41Z "GET /api/posts" HTTP/1.1 200 "-"
2017-01-01T12:12:42Z "GET /api/posts/56/comments" HTTP/1.1 200 "-"
2017-01-01T12:12:42Z "GET /api/posts" HTTP/1.1 200 "-"
2017-01-01T12:12:56Z "POST /api/posts" HTTP/1.1 202 "Safari"
2017-01-01T12:12:58Z "GET /api/posts/134/comments" HTTP/1.1 200 "-"

Чтобы разобрать, что вы могли бы написать что-то вроде:

_collector=access.log | regex parse "(?<method>[A-Z]+) /api/(?<path>[\w\d\/]+) HTTP"

Это извлечет METHOD и PATH из строк журнала, но вы увидите эти уникальные значения:

  • ПОЛУЧИТЬ посты
  • Посты
  • ПОЛУЧИТЬ посты /56/ комментарии
  • ПОЛУЧИТЬ посты /134/ комментарии

Я хочу отбросить все динамические части URL, чтобы вместо этого я мог найти следующее:

  • ПОЛУЧИТЬ посты
  • Посты
  • ПОЛУЧИТЬ посты /{id}/ комментарии

Я мог бы выяснить это в поиске и достаточно легко заменить регулярное выражение, но возможно ли это даже в сумологическом?

0 ответов

Другие вопросы по тегам