HA - Pacemaker - Как вставить пользовательское сообщение об ошибке в мой пользовательский сбой ресурса?

Я использую Pacemaker + Corosync в Centos7, я создаю свой собственный агент ресурсов и создаю собственный ресурс, который запускает некоторые мои скрипты.

Внутри моего агента ресурсов у меня есть функция монитора, которая проверяет что-то каждые x минут, и когда эта функция монитора перестала работать, я возвращаю "OCF_ERR_GENERIC", и, следовательно, все повторное использование завершилось неудачно.

Когда я выполняю команду "PCS status", я вижу, что ресурс остановлен /Failed, а также вижу в Failed Actions сообщение о том, что не удалось с "неизвестной ошибкой":

[root@pcmk01 opt]# pcs status
Cluster name: opt_cluster
Stack: corosync
Current DC: pcmk02-cr (version 1.1.15-11.el7_3.2-e174ec8) - partition with quorum
Last updated: Mon Jan 30 10:21:36 2017          Last change: Mon Jan 30 10:15:46 2017 by hacluster via crmd on pcmk02-cr

2 nodes and 5 resources configured

Online: [ pcmk01-cr pcmk02-cr ]

Full list of resources:

 Master/Slave Set: myoptClone01 [myopt_data01]
     Masters: [ pcmk01-cr ]
     Slaves: [ pcmk02-cr ]
 myopt_fs01     (ocf::heartbeat:Filesystem):    Started pcmk01-cr
 myopt_VIP01    (ocf::heartbeat:IPaddr2):       Started pcmk01-cr
 ServicesResource        (ocf::heartbeat:RADviewServices):       Stopped

Failed Actions:
* ServicesResource_monitor_120000 on pcmk02-cr **'unknown error'** (1): call=141, status=complete, exitreason='none',
    last-rc-change='Mon Jan 30 10:19:36 2017', queued=0ms, exec=142ms

Есть ли способ вставить мое собственное сообщение об ошибке вместо этого сообщения "неизвестная ошибка"???

1 ответ

Я не верю, что в любом случае можно получить более описательную ошибку в выводе crm_mon или же pcs status, Однако ошибки в этих выходных данных накладывают временную отметку на сбой. Внутри вашего собственного агента ресурса вы можете выводить все, что угодно, в журналы при ошибках. Затем вы можете проверить журналы вокруг отметки времени, показанной в pcs status вывод, чтобы получить более точную информацию о сбое.

Другие вопросы по тегам