IsolationForest, преобразование данных

Мы с коллегой пытаемся обнаружить аномалии в большом наборе данных. Мы хотим опробовать различные алгоритмы (LOF, OC-SVM, DBSCAN и т.д.), но в настоящее время мы работаем с IsolationForest.

Наш набор данных в настоящее время сформирован следующим образом. Это количество типов событий, регистрируемых на пользователя в день, и содержит> 300000 записей:

Мне очень интересно ваше мнение по этому поводу. Каковы наилучшие методы решения перечисленных выше проблем при использовании алгоритма IsolationForest для обнаружения аномалий?

0 ответов

Другие вопросы по тегам