Невозможно решить ошибку В h2o происходит в ядрах kaggle

Я пытаюсь запустить алгоритмы в H2o, так как набор данных довольно большой, и это проблема регрессии

Я участвую в соревновании только с ядром под названием " Предложение предложения Mercari Price", и поэтому мне нужно запускать и проверять код только в ядрах Kaggle.

Я использую язык R с 8 ГБ ОЗУ

Первоначально я был в состоянии запустить модель GLM и сохранить вывод CSV со следующим кодом

library(glm2)
glm.model2 <- h2o.glm( y = y.dep, x = x.indep, training_frame = train1.h2o, validation_frame = valid1.h2o
,family = "gaussian")

Glm работает быстро в течение 12 секунд без ошибок, но как только я пытаюсь запустить

либо gbm, либо базовая модель глубокого обучения, она выдает ошибку

library(gbm)
h2o.gbm(y=y.dep, x=x.indep, training_frame = train1.h2o,validation_frame = valid1.h2o, ntrees = 2000, max_depth = 4, learn_rate = 0.01)

library(randomForest)
rforest.model <- h2o.randomForest(y=y.dep, x=x.indep, training_frame = train1.h2o,validation_frame = valid1.h2o, ntrees = 1000, mtries = 3, max_depth = 4, seed = 1122)


 dlearning.model <- h2o.deeplearning(y = y.dep,
                                      x = x.indep,
                                       training_frame = train1.h2o,
                                       validation_frame = valid1.h2o,
                                       epoch = 60,
                                       hidden = c(100,100),
                                       activation = "Rectifier",
                                       seed = 1122
  )

Я получаю следующую ошибку снова и снова. Пожалуйста, предложите, что можно сделать, чтобы решить эту проблему, так как GLM работает очень хорошо, но все остальные не работают вообще

Error in .h2o.doSafeREST(h2oRestApiVersion = h2oRestApiVersion, urlSuffix = urlSuffix, : Unexpected CURL error: Failed to connect to localhost port 54321: Connection refused
Traceback:

Он терпит неудачу даже после достижения 10-11 процентов для обеих моделей, и я хочу знать, есть ли взлом или какое-либо мера, чтобы я мог по крайней мере запустить эти алгоритмы, чтобы я мог представить свой результат. Я не могу сделать построенную модель ансамбля из-за всего этого.

Любая мера, которую можно использовать, поскольку я запускаю их только в ядре kaggle

2 ответа

Вы не можете подключиться к серверу, потому что у ядер нет подключения к интернету.:)

Обновление: я сделал еще несколько копаний, и доступ к Интернету не должен быть проблемой здесь. Я сообщу об ошибке.

Failed to connect to localhost port 54321: Connection refused

Это проблема, вызванная тем, как Kaggle использует H2O в своих ядрах (вероятно, это образы Docker). Клиент H2O R не может подключиться к локальному серверу H2O, работающему по адресу localhost:54321.

Вы можете попробовать запустить кластер H2O на другом порту. Так что вместо запуска h2o.init() сделать что-то вроде h2o.init(port=44444), Если они позволяют многим людям запускать кластеры H2O на одном компьютере / порту, это может вызвать некоторые проблемы. Если вы уже подключены к кластеру H2O в своем сеансе, сначала запустите h2o.shutdown(prompt = FALSE) перед перезапуском H2O на другом порту.

Я также предлагаю вам связаться с администратором Kaggle, чтобы узнать, могут ли они помочь отладить проблему. Мы уже видели подобные проблемы с ядрами Kaggle.

Другие вопросы по тегам