Мониторинг Oracle в AWS: EM Express против облачного управления

Я ищу общий совет от любого, кто имеет опыт мониторинга баз данных Oracle RDS в AWS. В системе, с которой я работаю, в AWS будет задействовано несколько корпоративных баз данных Oracle RDS (порядка нескольких десятков). Моя организация рассматривает два варианта мониторинга:

  1. Настройка Cloud Control в AWS путем размещения OMS и базы данных репозитория в экземпляре EC2 и включения OEM_AGENT в наших экземплярах RDS.
  2. Полностью полагаясь на EM Express/CloudWatch и любое другое стороннее программное обеспечение, которое мы можем использовать без накладных расходов Cloud Control.

Проблема с вариантом 1 заключается в том, что он подрывает наши причины перехода на RDS, а именно устраняет некоторые административные накладные расходы по обслуживанию традиционных локальных баз данных Oracle. База данных репозитория OEM не может быть размещена в RDS, поскольку OMS требует доступа уровня SYS к репозиторию, а RDS не допускает этого. В результате облачный контроль потребовал бы большого количества техобслуживания, от которого мы надеялись отказаться.

Проблема с вариантом 2 в основном заключается в отсутствии метрического оповещения. CloudWatch/Enhanced Monitoring предоставляют некоторые базовые метрики для оповещений, но отсутствуют более конкретные метрики и оповещения, например, об ошибках журнала оповещений, табличных пространствах, длительных запросах, используемой области архива и т. Д. Мы не возражаем против отсутствия централизации, поскольку просто создадим внутреннюю страницу со ссылками на все различные базы данных, а EM Express предоставит нам то, что нам нужно с точки зрения мониторинга производительности. Единственное, что действительно беспокоит, так это отсутствие метрик оповещения. Если нет другого способа сделать это, мы также можем просто написать наши собственные сценарии PL/SQL для запуска предупреждений.

Однако мне любопытно узнать, как другие решали эту проблему или даже вообще, какие системы мониторинга Oracle на основе AWS были настроены и как они работают.

1 ответ

Проблемой сталкиваются практически все предприятия, которые переходят в облако сегодня. Компании переходят в облако, чтобы избавиться от некоторых своих административных задач, а затем выясняют, что они не могут выполнить всю настройку, которая была у них на премьере.

Итак, вот как вы можете сделать вариант 2 лучше. Особенно для решения вашей проблемы

Единственная проблема на самом деле заключается в отсутствии метрик оповещения

  1. События RDS - хороший способ мониторинга. Вы можете подписаться на события и получать уведомления несколькими способами, такими как групповая электронная почта, свободные каналы или средство контроля третьей части, такое как pagerduty.

  2. Использование интеграции событий RDS с Lambda. Я настоятельно рекомендую взглянуть на Lambda. Как я упоминал выше, помимо подписки на события, вы также можете вызывать / запускать лямбда-функцию для выполнения действий для определенных событий. Мы используем лямбду для преодоления ошибки пропуска ведомого в mysql.

  3. Другой вариант использования Lambda - это альтернатива работе cron. Такие вещи, как проверка дискового пространства каждый день, чтобы убедиться, что инкрементные резервные копии выполняются в течение ночи.

Дайте мне знать, если у вас есть конкретный вопрос о том, "как реализовать" эти варианты. Я буду рад добавить больше информации.

Другие вопросы по тегам