H2O - это платформа в памяти для распределенного масштабируемого машинного обучения. H2O использует знакомые интерфейсы, такие как R, Python, Scala, Java, JSON и блокнот / веб-интерфейс Flow, и без проблем работает с такими технологиями больших данных, как Hadoop и Spark. H2O предоставляет реализации многих популярных алгоритмов, таких как GBM, Random Forest, Deep Neural Networks, Word2Vec и Stacked Ensembles. Это проект с открытым исходным кодом, поддерживаемый H2O.ai (ранее известный как 0xdata).
1 ответ

"Не удалось подключиться к локальному порту 54321: соединение отказано"

Я не могу заставить H2O работать в моем R. Это показывает следующую ошибку. Понятия не имею, что это значит. Ранее это дало мне ошибку, потому что у меня не было 64-битной версии Java. Я загрузил 64-битную версию - перезапустил свой компьютер - и сн…
31 июл '18 в 04:21
0 ответов

Производство искрового трубопровода

Использование Sparkling Water/H2o v. 2.3 для прогноза. Я пытаюсь экспортировать модель искрового трубопровода, содержащую модель H2o. Оценка должна быть сделана на платформе на основе Java. Пожалуйста, предложите лучший метод для того же. Я изучал э…
02 май '18 в 04:37
1 ответ

h2o: различать локальный экземпляр и экземпляр hadoop

Есть ли способ от клиента Python, чтобы отличить случаи, когда H2O был запущен локально через java -jar h2o.jar и где он был запущен на Hadoop через hadoop -jar h2odriver.jar?
23 ноя '15 в 16:31
2 ответа

Кодировка строки UTF-8 с кириллицей в H2O

Я загружаю CSV-файл в кодировке UTF-8 с кириллическими строками. После синтаксического анализа в интерфейсе Flow - я вижу не кириллические, но не читаемые символы, такие как "как". Как я могу использовать строки кириллицы utf-8 в H2O?
26 июн '17 в 02:58
0 ответов

Извлечение перекрестно проверенных прогнозов и соответствующих идентификаторов - h2o.deeplearning

Я разрабатываю модель прогнозирования, используя машинное глубокое обучение с пакетом h2o на R. Модель выглядит следующим образом: m2 <- h2o.deeplearning( x=predictors, y=response, training_frame=train, hidden=c(25,25,25,25), epochs=100, nfolds=1…
23 апр '18 в 23:11
1 ответ

У меня есть несколько вопросов о распределенной модели случайного леса

Согласно документам H2O в FAQ раздела DRF, эта заметка упоминается в разделе "Как алгоритм обрабатывает пропущенные значения во время обучения?" ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ: Примечание: в отличие от GLM, в DRF числовые значения обрабатываются так же, к…
18 апр '18 в 09:13
1 ответ

Невозможно импортировать файл, используя h2o в Python

Я пытаюсь импортировать файл, используя h2o в Python. h2o.init () успешно, но когда я делаю следующее: df = h2o.import_file (path = "Объединенная база данных - Final.csv") Я получаю ряд ошибок, по которым не могу найти никакой помощи. Вот последний,…
31 авг '18 в 17:51
0 ответов

В R, есть ли способ интегрировать модель H2O ML в Sparklyr Pipeline?

То, что я вижу в официальных уроках, это использовать функцию as_h2o_frame в rsparkling преобразовать Spark кадр данных в h2o dataframe. Затем используйте h2o датафрейм как обычно. Интересно, есть ли способ интегрировать h2o алгоритмы (такие как h2o…
06 ноя '18 в 18:31
1 ответ

Невозможно прочитать файл, присутствующий на кластере H2O в RStudio

Я подключен к кластеру H2O и пытался прочитать файл.csv в R, но не смог его прочитать. Дать команду ниже после подключения к кластеру: data = h2o.importFile (path = "/ tmp", pattern = ". *. csv", destination_frame = "train-0.01m") Пожалуйста, предло…
16 мар '17 в 19:15
1 ответ

Кластер H2O неравномерное распределение производительности использования

Я настроил кластер с 4-ядерным (2 ГГц) и 16-ядерным (1,8 ГГц) виртуальным компьютером. Создание и подключение к кластеру работает без проблем. Но теперь я хочу провести глубокое изучение кластера, где я вижу неравномерное распределение для использов…
05 сен '17 в 13:57
1 ответ

H20: как использовать градиентное усиление для текстовых данных?

Я пытаюсь реализовать очень простую проблему обучения ML, где я использую текст, чтобы предсказать какой-то результат. В R некоторые основные примеры будут: импортировать поддельные, но забавные текстовые данные library(caret) library(dplyr) library…
14 июн '17 в 21:28
2 ответа

Как определить размер в байтах кадра H2O в Python?

Я загружаю кадры данных Spark в H2O (используя Python) для построения моделей машинного обучения. Мне было рекомендовано, чтобы я выделил кластер H2O с ОЗУ в 2-4 раза больше, чем кадр, на котором я буду тренироваться, чтобы анализ удобно помещался в…
27 мар '17 в 13:42
0 ответов

H2o Superlearner и квантиль оценка

Могу ли я запустить суперлиардер в H2O, который оценивает квантиль? Мой R-код следующий: library(h2o) h2o.init() h2o_data_estimation <- h2o.importFile(path="http://mldata.org/repository/data/download/csv/book-evaluation-complete") neuralnet_h2o_q…
19 авг '18 в 23:13
1 ответ

Почему в таблице H2O Gains/Lift только 16 строк? Как их следует интерпретировать?

В последней документации H2O говорится, что "данные разделены на группы по квантильным порогам вероятности ответа. Обратите внимание, что число групп по умолчанию равно 20; если имеется менее 20 уникальных значений вероятности, то число групп уменьш…
29 июн '18 в 18:41
0 ответов

Как я могу использовать алгоритм дерева решений в H2O?

Я пытаюсь обучить модель дерева решений с помощью H2O. Мне известно, что в h2o нет специальной библиотеки для деревьев решений. Это код, когда я использую алгоритм GBM в H2O, но я могу использовать Decision Tree следующим образом. Потому что в h2o н…
29 авг '18 в 02:30
0 ответов

Как сохранить участок H2O в объекте R

H2O имеет ряд функций, которые могут выводить графики, такие как h2o.varimp_plot(model) или же plot(gbm.model, 'rmse'), Вместо того, чтобы выводить график на устройство, как лучше всего сохранить полученный график в объекте R?
26 янв '18 в 06:08
1 ответ

Пользовательская функция потерь в H2O

Я довольно новичок в H2O и обращаюсь к нему через R. Я пытаюсь построить модели произвольного леса, XGBoost, GBM для решения проблемы мультикласса. Представления о производительности модели, которые предоставляет H2O, великолепны, но в качестве одно…
07 сен '18 в 17:52
1 ответ

Объект из as.h2o имеет небольшое наблюдение в R

Я пытался преобразовать данные R в данные H2O, используя as.h2o функция. Однако число наблюдений, трансформированных as.h2o функция снижена до 10. Всего в моих данных 1000 наблюдений. Есть 700 данных поезда и 300 данных испытаний. Однако, используя …
26 июл '17 в 06:35
1 ответ

h2o - Какая разница между zip-файлом MOJO и файлом genmodel.jar.

Я выяснил, как загружать модели в виде MOJO и как использовать их для прогнозирования новых наборов данных в формате.csv. Я хотел немного лучше понять, как файл.zip модели и файлы h2o-genmodel.jar связаны друг с другом. Вот мои вопросы? 1.) Какова т…
16 апр '18 в 18:30
3 ответа

R H2O пакет импорта CSV-файла с китайскими иероглифами

У меня есть большой набор данных в csv формат для построения модели прогнозирования. Из-за его размера я планировал использовать h2o пакет в R, чтобы построить модель. Однако данные в нескольких столбцах data.frame, содержит некоторые китайские упро…
13 янв '17 в 04:14