HA - Pacemaker - Как вставить пользовательское сообщение об ошибке в мой пользовательский сбой ресурса?
Я использую Pacemaker + Corosync в Centos7, я создаю свой собственный агент ресурсов и создаю собственный ресурс, который запускает некоторые мои скрипты.
Внутри моего агента ресурсов у меня есть функция монитора, которая проверяет что-то каждые x минут, и когда эта функция монитора перестала работать, я возвращаю "OCF_ERR_GENERIC", и, следовательно, все повторное использование завершилось неудачно.
Когда я выполняю команду "PCS status", я вижу, что ресурс остановлен /Failed, а также вижу в Failed Actions сообщение о том, что не удалось с "неизвестной ошибкой":
[root@pcmk01 opt]# pcs status
Cluster name: opt_cluster
Stack: corosync
Current DC: pcmk02-cr (version 1.1.15-11.el7_3.2-e174ec8) - partition with quorum
Last updated: Mon Jan 30 10:21:36 2017 Last change: Mon Jan 30 10:15:46 2017 by hacluster via crmd on pcmk02-cr
2 nodes and 5 resources configured
Online: [ pcmk01-cr pcmk02-cr ]
Full list of resources:
Master/Slave Set: myoptClone01 [myopt_data01]
Masters: [ pcmk01-cr ]
Slaves: [ pcmk02-cr ]
myopt_fs01 (ocf::heartbeat:Filesystem): Started pcmk01-cr
myopt_VIP01 (ocf::heartbeat:IPaddr2): Started pcmk01-cr
ServicesResource (ocf::heartbeat:RADviewServices): Stopped
Failed Actions:
* ServicesResource_monitor_120000 on pcmk02-cr **'unknown error'** (1): call=141, status=complete, exitreason='none',
last-rc-change='Mon Jan 30 10:19:36 2017', queued=0ms, exec=142ms
Есть ли способ вставить мое собственное сообщение об ошибке вместо этого сообщения "неизвестная ошибка"???
1 ответ
Я не верю, что в любом случае можно получить более описательную ошибку в выводе crm_mon
или же pcs status
, Однако ошибки в этих выходных данных накладывают временную отметку на сбой. Внутри вашего собственного агента ресурса вы можете выводить все, что угодно, в журналы при ошибках. Затем вы можете проверить журналы вокруг отметки времени, показанной в pcs status
вывод, чтобы получить более точную информацию о сбое.