Встречаются исключения: vector::_M_default_append в LightGBM параллельно работает на двух машинах
Я пытался запустить LightGBM параллельно на двух машинах в соответствии с документацией. Я просто скопировал демо-конфигурацию и файл данных в каталог examples/parallel_learning и собрал исполнительный файл lightgbm в новый каталог следующим образом:
Затем изменил mlist.txt следующим образом:
и train.conf следующим образом:
Тогда бег получил мне следующий результат:
На другой машине досталось это:
Как видно из информации о печати, машины dmp1 и dmp5 могут успешно обмениваться данными друг с другом по сети, но сначала dmp1 столкнулся с вектором исключения ::_M_default_append и вышел из него, что вызвало ошибку восстановления сокета на машине dmp5.
Я попытался запустить lightGBM через командную строку на одном компьютере, используя тот же набор данных, все в порядке. Так, может быть, может исключить вопрос, связанный со строительством (?)
Кто-нибудь знает, как избавиться от вышеуказанного вопроса? Большое спасибо.