PM2 не перезапускает кластеры при ошибках
Когда я использую PM2 для запуска нескольких процессов (то есть в режиме кластера), и один из этих процессов сталкивается с неперехваченной ошибкой, PM2 не перезапускает этот процесс.
Зачем?
Как сделать так, чтобы он перезапускал работников в кластерном режиме?
Пример кода
// index.js
let counter = 0;
setInterval(function(){
if(counter >= 5) {
throw new Error('Worker crash. Why no restart?');
}
counter++;
console.log('Worker alive: ' + Date.now() );
},500);
Запустить на линии cmd
pm2 start index.js -i 4
pm2 log
В конце концов все рабочие рушатся и никогда не перезагружаются.
Какой смысл перезапускать, если это можно сделать только на одном процессе.
Логи PM2 (объединены в один файл)
Worker alive: 1522937847186
Worker alive: 1522937847231
Worker alive: 1522937847276
Worker alive: 1522937847324
Worker alive: 1522937847691
Worker alive: 1522937847736
Worker alive: 1522937847781
Worker alive: 1522937847830
Worker alive: 1522937848193
Worker alive: 1522937848238
Worker alive: 1522937848283
Worker alive: 1522937848332
Worker alive: 1522937848693
Worker alive: 1522937848738
Worker alive: 1522937848783
Worker alive: 1522937848832
Worker alive: 1522937849194
Worker alive: 1522937849238
Worker alive: 1522937849284
Worker alive: 1522937849333
Error: Worker crash. Why no restart?
at Timeout._onTimeout (/home/usrname/docs/Projects_NodeJS/project/app/index.js:49:11)
at ontimeout (timers.js:466:11)
at tryOnTimeout (timers.js:304:5)
at Timer.listOnTimeout (timers.js:267:5)
Error: Worker crash. Why no restart?
at Timeout._onTimeout (/home/usrname/docs/Projects_NodeJS/project/app/index.js:49:11)
at ontimeout (timers.js:466:11)
at tryOnTimeout (timers.js:304:5)
at Timer.listOnTimeout (timers.js:267:5)
Error: Worker crash. Why no restart?
at Timeout._onTimeout (/home/usrname/docs/Projects_NodeJS/project/app/index.js:49:11)
at ontimeout (timers.js:466:11)
at tryOnTimeout (timers.js:304:5)
at Timer.listOnTimeout (timers.js:267:5)
Error: Worker crash. Why no restart?
at Timeout._onTimeout (/home/usrname/docs/Projects_NodeJS/project/app/index.js:49:11)
at ontimeout (timers.js:466:11)
at tryOnTimeout (timers.js:304:5)
at Timer.listOnTimeout (timers.js:267:5)
2 ответа
Решение
Переход на Node версии 8 LTS, похоже, решил проблему.
У меня был установлен Node версии 9, и проблема возникла как в Windows, так и в Ubuntu, но когда я перешел на версию 8, все заработало.
Вы можете попробовать код ниже. Дайте мне знать, если это поможет.
const cluster = require('cluster');
const numOfCPUs = require('os').cpus().length;
if (cluster.isMaster) {
console.log(`Master ${process.pid} is running`);
// Fork workers.
for (let i = 0; i < numOfCPUs; i++) {
cluster.fork();
}
cluster.on('exit', (worker, code, signal) => {
console.log('worker %d died (%s). restarting...',
worker.process.pid, signal || code);
cluster.fork();
});
}