Зависимость от ресурсов кардиостимулятора, начиная

Моя проблема связана с кардиостимулятором. Например, у кластера кардиостимулятора есть два ресурса, один из которых запускается, например, требуется 3 минуты, затем в течение этих 3 минут, если произошел сбой другого монитора ресурсов, он не будет немедленно вызывать метод stop/start для перезапуска, а ожидает первого ресурс для начала завершен. После полного запуска первого ресурса второй ресурс начинает перезапуск, кто-нибудь знает почему? Большое спасибо! Моя кластерная версия: corosync 2.3.4 кардиостимулятор 1.1.13

2 ответа

Моя конфигурация кластера выглядит следующим образом. И для отладки я добавил "сон 60" для запуска функции ocf.

crm configure show
node 168002177: 192.168.2.177
node 168002178: 192.168.2.178
node 168002179: 192.168.2.179
primitive fm_mgt fm_mgt \
        op monitor interval=20s timeout=120s \
        op stop interval=0 timeout=120s on-fail=restart \
        op start interval=0 timeout=120s on-fail=restart \
        meta target-role=Started
primitive logserver logserver \
        op monitor interval=20s timeout=120s \
        op stop interval=0 timeout=120s on-fail=restart \
        op start interval=0 timeout=120s on-fail=restart \
        meta target-role=Started
clone fm_mgt_replica fm_mgt
clone logserver_replica logserver
property cib-bootstrap-options: \
        have-watchdog=false \
        dc-version=1.1.13-10.el7-44eb2dd \
        cluster-infrastructure=corosync \
        stonith-enabled=false \
        start-failure-is-fatal=false

Когда я убиваю службу fm_mgt на 177 узле, а затем убиваю службу logserver на 177, для запуска fm_mgt требуется как минимум один минит, в этом мините, logserver не будет перезапущен до полного восстановления fm_mgt.

crm status
Last updated: Thu Oct 26 06:40:24 2017          Last change: Thu Oct 26     06:36:33 2017 by root via crm_resource on 192.168.2.177
Stack: corosync
Current DC: 192.168.2.179 (version 1.1.13-10.el7-44eb2dd) - partition with quorum
3 nodes and 6 resources configured

Online: [ 192.168.2.177 192.168.2.178 192.168.2.179 ]

Full list of resources:

 Clone Set: logserver_replica [logserver]
     logserver  (ocf::heartbeat:logserver):     FAILED 192.168.2.177
     Started: [ 192.168.2.178 192.168.2.179 ]
 Clone Set: fm_mgt_replica [fm_mgt]
     Started: [ 192.168.2.178 192.168.2.179 ]
     Stopped: [ 192.168.2.177 ]
Другие вопросы по тегам