Невозможно решить ошибку В h2o происходит в ядрах kaggle
Я пытаюсь запустить алгоритмы в H2o, так как набор данных довольно большой, и это проблема регрессии
Я участвую в соревновании только с ядром под названием " Предложение предложения Mercari Price", и поэтому мне нужно запускать и проверять код только в ядрах Kaggle.
Я использую язык R с 8 ГБ ОЗУ
Первоначально я был в состоянии запустить модель GLM и сохранить вывод CSV со следующим кодом
library(glm2)
glm.model2 <- h2o.glm( y = y.dep, x = x.indep, training_frame = train1.h2o, validation_frame = valid1.h2o
,family = "gaussian")
Glm работает быстро в течение 12 секунд без ошибок, но как только я пытаюсь запустить
либо gbm, либо базовая модель глубокого обучения, она выдает ошибку
library(gbm)
h2o.gbm(y=y.dep, x=x.indep, training_frame = train1.h2o,validation_frame = valid1.h2o, ntrees = 2000, max_depth = 4, learn_rate = 0.01)
library(randomForest)
rforest.model <- h2o.randomForest(y=y.dep, x=x.indep, training_frame = train1.h2o,validation_frame = valid1.h2o, ntrees = 1000, mtries = 3, max_depth = 4, seed = 1122)
dlearning.model <- h2o.deeplearning(y = y.dep,
x = x.indep,
training_frame = train1.h2o,
validation_frame = valid1.h2o,
epoch = 60,
hidden = c(100,100),
activation = "Rectifier",
seed = 1122
)
Я получаю следующую ошибку снова и снова. Пожалуйста, предложите, что можно сделать, чтобы решить эту проблему, так как GLM работает очень хорошо, но все остальные не работают вообще
Error in .h2o.doSafeREST(h2oRestApiVersion = h2oRestApiVersion, urlSuffix = urlSuffix, : Unexpected CURL error: Failed to connect to localhost port 54321: Connection refused
Traceback:
Он терпит неудачу даже после достижения 10-11 процентов для обеих моделей, и я хочу знать, есть ли взлом или какое-либо мера, чтобы я мог по крайней мере запустить эти алгоритмы, чтобы я мог представить свой результат. Я не могу сделать построенную модель ансамбля из-за всего этого.
Любая мера, которую можно использовать, поскольку я запускаю их только в ядре kaggle
2 ответа
Вы не можете подключиться к серверу, потому что у ядер нет подключения к интернету.:)
Обновление: я сделал еще несколько копаний, и доступ к Интернету не должен быть проблемой здесь. Я сообщу об ошибке.
Failed to connect to localhost port 54321: Connection refused
Это проблема, вызванная тем, как Kaggle использует H2O в своих ядрах (вероятно, это образы Docker). Клиент H2O R не может подключиться к локальному серверу H2O, работающему по адресу localhost:54321.
Вы можете попробовать запустить кластер H2O на другом порту. Так что вместо запуска h2o.init()
сделать что-то вроде h2o.init(port=44444)
, Если они позволяют многим людям запускать кластеры H2O на одном компьютере / порту, это может вызвать некоторые проблемы. Если вы уже подключены к кластеру H2O в своем сеансе, сначала запустите h2o.shutdown(prompt = FALSE)
перед перезапуском H2O на другом порту.
Я также предлагаю вам связаться с администратором Kaggle, чтобы узнать, могут ли они помочь отладить проблему. Мы уже видели подобные проблемы с ядрами Kaggle.