Задержка запуска ресурса кардиостимулятора при запуске или остановке другого ресурса

У меня есть два клонированных ресурса в моем кластере corosync/pacemaker. Это fm_mgt и logserver. Оба их РАС ок. fm_mgt для запуска службы требуется 1 минута (вызов функции запуска ocf в течение 1 минуты). Настроен как показано ниже:

# crm configure show
node 168002177: 192.168.2.177
node 168002178: 192.168.2.178
node 168002179: 192.168.2.179
primitive fm_mgt fm_mgt \
        op monitor interval=20s timeout=120s \
        op stop interval=0 timeout=120s on-fail=restart \
        op start interval=0 timeout=120s on-fail=restart \
        meta target-role=Started
primitive logserver logserver \
        op monitor interval=20s timeout=120s \
        op stop interval=0 timeout=120s on-fail=restart \
        op start interval=0 timeout=120s on-fail=restart \
        meta target-role=Started
clone fm_mgt_replica fm_mgt
clone logserver_replica logserver
property cib-bootstrap-options: \
        have-watchdog=false \
        dc-version=1.1.13-10.el7-44eb2dd \
        cluster-infrastructure=corosync \
        stonith-enabled=false \
        start-failure-is-fatal=false

Когда я убиваю службу fm_mgt на одном узле, кардиостимулятор немедленно восстановит ее после сбоя монитора. Это выглядит совершенно нормально. Но в течение этой 1 минуты запуска fm_mgt, если я уничтожу службу logserver на каком-либо узле, монитор тоже нормально поймает сбой ,, но кардиостимулятор не перезапустит его немедленно, но ожидает полного запуска fm_mgt. После полного запуска fm_mgt кардиостимулятор начинает перезапускать сервер журналов. Кажется, что есть некоторая зависимость между ресурсом кардиостимулятора.

# crm status
Last updated: Thu Oct 26 06:40:24 2017          Last change: Thu Oct 26     06:36:33 2017 by root via crm_resource on 192.168.2.177
Stack: corosync
Current DC: 192.168.2.179 (version 1.1.13-10.el7-44eb2dd) - partition with quorum
3 nodes and 6 resources configured
Online: [ 192.168.2.177 192.168.2.178 192.168.2.179 ]
Full list of resources:
 Clone Set: logserver_replica [logserver]
     logserver  (ocf::heartbeat:logserver):     FAILED 192.168.2.177
     Started: [ 192.168.2.178 192.168.2.179 ]
 Clone Set: fm_mgt_replica [fm_mgt]
     Started: [ 192.168.2.178 192.168.2.179 ]
     Stopped: [ 192.168.2.177 ]

Я очень сильно запутался. Что-то не так настраиваете? Спасибо большое!

Джеймс

с уважением

0 ответов

Другие вопросы по тегам