Можем ли мы увидеть список алгоритмов, используемых DriverlessAI?
Я новичок в H2O DAI, и я думаю, что это прекрасно. Я провел несколько экспериментов с небольшими образцами данных CSV, и большую часть времени я вижу, что используются GLM и GBM.
Можем ли мы увидеть полный список всех алгоритмов, предоставляемых H2O DAI?
Я вижу алгоритмы с открытым исходным кодом H2O, но то же самое с H2O DAI?
Еще один вопрос: есть ли способ выбрать алгоритм для использования вручную?
1 ответ
Обратите внимание, что H2O-3 - это отдельный продукт с открытым исходным кодом, который не совпадает с продуктом DAI H2O.ai.
Лучший способ найти ответ на все ваши вопросы - это посмотреть документацию AI без драйверов: http://docs.h2o.ai/driverless-ai/latest-stable/docs/userguide/index.html
Для вашего удобства я опубликую ответы на ваши вопросы, но всем, кто столкнется с этим вопросом позже, я настоятельно рекомендую просто посмотреть документы, поскольку то, что я сейчас заявляю, может быстро устареть.
Можем ли мы увидеть полный список всех алгоритмов, предоставляемых H2O DAI? (ответ в FAQ)
Какие алгоритмы используются в AI без драйверов?
Функции разработаны с использованием собственного стека статистических подходов, выигрышных в Kaggle, включая некоторые из самых сложных целевых кодировок и оценок вероятности, основанных на группировках, агрегациях и объединениях, но мы также используем линейные модели, нейронные сети, модели кластеризации и уменьшения размерности и многие традиционные такие подходы, как однократное кодирование и т. д.
Вдобавок к разработанным функциям предусмотрены сложные модели, в том числе, но не ограничиваясь: XGBoost (как в исходном режиме XGBoost, так и в режиме 'lossguide' (LightGBM)), GLM, TensorFlow (включая рецепт TensorFlow NLP на основе моделей CNN Deeplearning), и RuleFit. Больше будет добавлено позже.
В общем, GBM - лучшие алгоритмы одиночного выстрела. С 2006 года методы повышения эффективности оказались наиболее точными для задач шумового прогнозирующего моделирования, помимо распознавания образов в изображениях и звуке ( https://www.cs.cornell.edu/~caruana/ctp/ct.papers/caruana.icml06.pdf). Появление XGBoost и Kaggle только укрепило эту позицию.
Есть ли способ, которым я могу выбрать, какой алгоритм использовать вручную? (ответ найден в разделе настроек эксперта):
В определенной степени да, вы можете выбрать, какие алгоритмы вы хотите, используя экспертные настройки, описанные в ссылке выше.