Мониторинг Oracle в AWS: EM Express против облачного управления
Я ищу общий совет от любого, кто имеет опыт мониторинга баз данных Oracle RDS в AWS. В системе, с которой я работаю, в AWS будет задействовано несколько корпоративных баз данных Oracle RDS (порядка нескольких десятков). Моя организация рассматривает два варианта мониторинга:
- Настройка Cloud Control в AWS путем размещения OMS и базы данных репозитория в экземпляре EC2 и включения OEM_AGENT в наших экземплярах RDS.
- Полностью полагаясь на EM Express/CloudWatch и любое другое стороннее программное обеспечение, которое мы можем использовать без накладных расходов Cloud Control.
Проблема с вариантом 1 заключается в том, что он подрывает наши причины перехода на RDS, а именно устраняет некоторые административные накладные расходы по обслуживанию традиционных локальных баз данных Oracle. База данных репозитория OEM не может быть размещена в RDS, поскольку OMS требует доступа уровня SYS к репозиторию, а RDS не допускает этого. В результате облачный контроль потребовал бы большого количества техобслуживания, от которого мы надеялись отказаться.
Проблема с вариантом 2 в основном заключается в отсутствии метрического оповещения. CloudWatch/Enhanced Monitoring предоставляют некоторые базовые метрики для оповещений, но отсутствуют более конкретные метрики и оповещения, например, об ошибках журнала оповещений, табличных пространствах, длительных запросах, используемой области архива и т. Д. Мы не возражаем против отсутствия централизации, поскольку просто создадим внутреннюю страницу со ссылками на все различные базы данных, а EM Express предоставит нам то, что нам нужно с точки зрения мониторинга производительности. Единственное, что действительно беспокоит, так это отсутствие метрик оповещения. Если нет другого способа сделать это, мы также можем просто написать наши собственные сценарии PL/SQL для запуска предупреждений.
Однако мне любопытно узнать, как другие решали эту проблему или даже вообще, какие системы мониторинга Oracle на основе AWS были настроены и как они работают.
1 ответ
Проблемой сталкиваются практически все предприятия, которые переходят в облако сегодня. Компании переходят в облако, чтобы избавиться от некоторых своих административных задач, а затем выясняют, что они не могут выполнить всю настройку, которая была у них на премьере.
Итак, вот как вы можете сделать вариант 2 лучше. Особенно для решения вашей проблемы
Единственная проблема на самом деле заключается в отсутствии метрик оповещения
События RDS - хороший способ мониторинга. Вы можете подписаться на события и получать уведомления несколькими способами, такими как групповая электронная почта, свободные каналы или средство контроля третьей части, такое как pagerduty.
Использование интеграции событий RDS с Lambda. Я настоятельно рекомендую взглянуть на Lambda. Как я упоминал выше, помимо подписки на события, вы также можете вызывать / запускать лямбда-функцию для выполнения действий для определенных событий. Мы используем лямбду для преодоления ошибки пропуска ведомого в mysql.
Другой вариант использования Lambda - это альтернатива работе cron. Такие вещи, как проверка дискового пространства каждый день, чтобы убедиться, что инкрементные резервные копии выполняются в течение ночи.
Дайте мне знать, если у вас есть конкретный вопрос о том, "как реализовать" эти варианты. Я буду рад добавить больше информации.