Мадам монитор пропускает события и показывает другие несколько

У меня проблема с мониторингом MDADM, я не правильно понимаю события. Я попробовал 2 сценария на чистой виртуальной машине Ubuntu. Позволь мне объяснить.

У меня есть простой скрипт, который перехватывает события и сохраняет их в лог-файл. Результат точно такой же, если я позволяю файлу монитора отправлять мне письма, но файл журнала было легче объяснить

Поэтому я выполняю файл журнала в MDADM.conf

# instruct the monitoring daemon where to send mail alerts
MAILADDR root
PROGRAM /root/scripts/monitor_array.sh

Первый сценарий: 4 HD в Raid5

md0 : active raid5 sdb1[5] sde1[4] sdd1[2] sdc1[1]
      58540032 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/4] [UUUU]

(1) Я добавляю запасной: mdadm --manage /dev/md0 --add /dev/sdf1

Запасной присутствует

md0 : active raid5 sdf1[6](S) sdb1[5] sde1[4] sdd1[2] sdc1[1]
      58540032 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/4] [UUUU]

(2) Я установил один диск как неисправный: mdadm --manage /dev/md0 --set-faulty /dev/sdb1 Рейд автоматически забирает запасной и восстанавливает

Personalities : [raid6] [raid5] [raid4] [linear] [multipath] [raid0] [raid1] [raid10]
md0 : active raid5 sdf1[6] sdb1[5](F) sde1[4] sdd1[2] sdc1[1]
      58540032 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/3] [_UUU]
      [====>................]  recovery = 24.6% (4807680/19513344) finish=1.2min speed=200320K/sec

Лог в этом случае

***************************
05-02-18 / 00:04:52
Fail
/dev/md0
/dev/sdb1
***************************
***************************
05-02-18 / 00:04:55
RebuildStarted
/dev/md0

***************************
***************************
05-02-18 / 00:06:30
RebuildFinished
/dev/md0

***************************
***************************
05-02-18 / 00:06:30
SpareActive
/dev/md0
/dev/sdf1
***************************

Все шаги видны, но я не вижу события "Rebuild20, 40, 60, 80", но это может быть приемлемым

Сценарий (2)

Здесь я делаю то же самое, но без запасного я начинаю со следующего конфига

md0 : active raid5 sdb1[5] sde1[4] sdd1[2] sdc1[1]
      58540032 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/4] [UUUU]

(1) Я установил один диск как неисправный: mdadm --manage /dev/md0 --set-faulty /dev/sdb1

Диск отображается как сбой в mdstat и в журнале

md0 : active raid5 sdb1[5](F) sde1[4] sdd1[2] sdc1[1]
      58540032 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/3] [_UUU]

и в журнале

***************************
05-02-18 / 00:17:36
Fail
/dev/md0
/dev/sdb1
***************************

(2) Проблема появляется сейчас, я добавляю диск: mdadm --manage /dev/md0 --add /dev/sdf1

md0 : active raid5 sdf1[6] sdb1[5](F) sde1[4] sdd1[2] sdc1[1]
      58540032 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/3] [_UUU]
      [=>...................]  recovery =  7.1% (1398332/19513344) finish=1.5min speed=199761K/sec

Журнал показывает одновременно 3 события

***************************
05-02-18 / 00:20:52
RebuildStarted
/dev/md0

***************************
***************************
05-02-18 / 00:20:52
RebuildFinished
/dev/md0

***************************
***************************
05-02-18 / 00:20:52
RebuildStarted
/dev/md0

***************************

и через некоторое время

***************************
05-02-18 / 00:22:30
RebuildFinished
/dev/md0

***************************
***************************
05-02-18 / 00:22:30
SpareActive
/dev/md0
/dev/sdf1
***************************

Итак, в основном, почему мониторинг показывает одновременно несколько Rebuild / Start /finish и почему система не показывает событие rebuild20/40/60/80?

0 ответов

Я думаю, вы просто ожидаете слишком многого от монитора mdadm, но для промежуточных отчетов вы читали об опциях -r?:

-r, --increment
       Give a percentage  increment.   mdadm  will  generate  RebuildNN
       events with the given percentage increment.
Другие вопросы по тегам