Мадам монитор пропускает события и показывает другие несколько
У меня проблема с мониторингом MDADM, я не правильно понимаю события. Я попробовал 2 сценария на чистой виртуальной машине Ubuntu. Позволь мне объяснить.
У меня есть простой скрипт, который перехватывает события и сохраняет их в лог-файл. Результат точно такой же, если я позволяю файлу монитора отправлять мне письма, но файл журнала было легче объяснить
Поэтому я выполняю файл журнала в MDADM.conf
# instruct the monitoring daemon where to send mail alerts
MAILADDR root
PROGRAM /root/scripts/monitor_array.sh
Первый сценарий: 4 HD в Raid5
md0 : active raid5 sdb1[5] sde1[4] sdd1[2] sdc1[1]
58540032 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/4] [UUUU]
(1) Я добавляю запасной: mdadm --manage /dev/md0 --add /dev/sdf1
Запасной присутствует
md0 : active raid5 sdf1[6](S) sdb1[5] sde1[4] sdd1[2] sdc1[1]
58540032 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/4] [UUUU]
(2) Я установил один диск как неисправный: mdadm --manage /dev/md0 --set-faulty /dev/sdb1 Рейд автоматически забирает запасной и восстанавливает
Personalities : [raid6] [raid5] [raid4] [linear] [multipath] [raid0] [raid1] [raid10]
md0 : active raid5 sdf1[6] sdb1[5](F) sde1[4] sdd1[2] sdc1[1]
58540032 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/3] [_UUU]
[====>................] recovery = 24.6% (4807680/19513344) finish=1.2min speed=200320K/sec
Лог в этом случае
***************************
05-02-18 / 00:04:52
Fail
/dev/md0
/dev/sdb1
***************************
***************************
05-02-18 / 00:04:55
RebuildStarted
/dev/md0
***************************
***************************
05-02-18 / 00:06:30
RebuildFinished
/dev/md0
***************************
***************************
05-02-18 / 00:06:30
SpareActive
/dev/md0
/dev/sdf1
***************************
Все шаги видны, но я не вижу события "Rebuild20, 40, 60, 80", но это может быть приемлемым
Сценарий (2)
Здесь я делаю то же самое, но без запасного я начинаю со следующего конфига
md0 : active raid5 sdb1[5] sde1[4] sdd1[2] sdc1[1]
58540032 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/4] [UUUU]
(1) Я установил один диск как неисправный: mdadm --manage /dev/md0 --set-faulty /dev/sdb1
Диск отображается как сбой в mdstat и в журнале
md0 : active raid5 sdb1[5](F) sde1[4] sdd1[2] sdc1[1]
58540032 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/3] [_UUU]
и в журнале
***************************
05-02-18 / 00:17:36
Fail
/dev/md0
/dev/sdb1
***************************
(2) Проблема появляется сейчас, я добавляю диск: mdadm --manage /dev/md0 --add /dev/sdf1
md0 : active raid5 sdf1[6] sdb1[5](F) sde1[4] sdd1[2] sdc1[1]
58540032 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/3] [_UUU]
[=>...................] recovery = 7.1% (1398332/19513344) finish=1.5min speed=199761K/sec
Журнал показывает одновременно 3 события
***************************
05-02-18 / 00:20:52
RebuildStarted
/dev/md0
***************************
***************************
05-02-18 / 00:20:52
RebuildFinished
/dev/md0
***************************
***************************
05-02-18 / 00:20:52
RebuildStarted
/dev/md0
***************************
и через некоторое время
***************************
05-02-18 / 00:22:30
RebuildFinished
/dev/md0
***************************
***************************
05-02-18 / 00:22:30
SpareActive
/dev/md0
/dev/sdf1
***************************
Итак, в основном, почему мониторинг показывает одновременно несколько Rebuild / Start /finish и почему система не показывает событие rebuild20/40/60/80?
0 ответов
Я думаю, вы просто ожидаете слишком многого от монитора mdadm, но для промежуточных отчетов вы читали об опциях -r
?:
-r, --increment
Give a percentage increment. mdadm will generate RebuildNN
events with the given percentage increment.