Встречаются исключения: vector::_M_default_append в LightGBM параллельно работает на двух машинах

Я пытался запустить LightGBM параллельно на двух машинах в соответствии с документацией. Я просто скопировал демо-конфигурацию и файл данных в каталог examples/parallel_learning и собрал исполнительный файл lightgbm в новый каталог следующим образом: введите описание изображения здесь

Затем изменил mlist.txt следующим образом: введите описание изображения здесь

и train.conf следующим образом: введите описание изображения здесь

Тогда бег получил мне следующий результат: введите описание изображения здесь

На другой машине досталось это: введите описание изображения здесь

Как видно из информации о печати, машины dmp1 и dmp5 могут успешно обмениваться данными друг с другом по сети, но сначала dmp1 столкнулся с вектором исключения ::_M_default_append и вышел из него, что вызвало ошибку восстановления сокета на машине dmp5.

Я попытался запустить lightGBM через командную строку на одном компьютере, используя тот же набор данных, все в порядке. Так, может быть, может исключить вопрос, связанный со строительством (?)

Кто-нибудь знает, как избавиться от вышеуказанного вопроса? Большое спасибо.

0 ответов

Другие вопросы по тегам