WSO2 ML Cross Validation и Grid Search
Я хотел бы знать, реализует ли WSO2 ML кросс-валидацию и поиск по сетке для выбора лучшей модели.
1 ответ
В настоящее время (начиная с версии 1.1.0) WSO2 Machine Learner не имеет прямого метода оптимизации гиперпараметров. Как уже упоминалось в вашем вопросе, мы планируем включить случайный поиск и поиск по сетке в одном из следующих выпусков. Чтобы отслеживать ход этого процесса, я создал публичную JIRA [1]. Поэтому, когда новая функция будет готова, я сообщу вам об этом с помощью этого вопроса.
Далее позвольте мне кратко описать процесс перекрестной проверки, который мы используем на сервере машинного обучения WSO2. На третьем этапе мастера ML ML Server вы можете установить долю обучающих данных (см. Прикрепленный снимок экрана).
Допустим, вы выбрали 0,7 ваших данных для обучения. Затем процесс построения модели будет использовать 70% ваших данных для обучения, а остальные наборы данных (т.е. 30%) будут использоваться для перекрестной проверки. Как вы могли бы признать, это самый базовый подход для перекрестной проверки, и он не особенно подходит для небольших наборов данных. Поэтому в будущих выпусках мы планируем включить K-кратную перекрестную проверку [2] в дополнение к доступному в настоящее время методу перекрестной проверки.
Янди, если вам нужна дополнительная помощь по этому вопросу или что-либо, связанное с нашим продуктом, пожалуйста, дайте мне знать.
Спасибо,
Upul
[1] https://wso2.org/jira/browse/ML-313
[2] https://en.wikipedia.org/wiki/Cross-validation_(statistics)