Как бороться со сбоями в Docker Swarm?
У меня есть рой кластер с 5 узлами. У меня есть 5 реплик для некоторых служб, выставленных в порту 1234
,
Все работает отлично. Проблема в том, что я добавил какой-то инструмент (двоичный файл, работающий на каждом узле роя, однако это не сервис роя (это собственный инструмент, а не кластер), который собирается подключаться к указанному сервису (через порт). 1234
).
Я жестко запрограммирован в конфигурации этого инструмента: <ip address of arbitrary swarm node, let 10.0.0.1>:1234
и все еще в порядке.
Проблема в том, когда машина с 10.0.0.1
умереть. Затем этот инструмент не может запуститься и после некоторых попыток он также умрет.
Можно ли это исправить с помощью какого-то роевого механизма? Если нет, что мне делать?