IsolationForest, преобразование данных
Мы с коллегой пытаемся обнаружить аномалии в большом наборе данных. Мы хотим опробовать различные алгоритмы (LOF, OC-SVM, DBSCAN и т.д.), но в настоящее время мы работаем с IsolationForest.
Наш набор данных в настоящее время сформирован следующим образом. Это количество типов событий, регистрируемых на пользователя в день, и содержит> 300000 записей:
Мне очень интересно ваше мнение по этому поводу. Каковы наилучшие методы решения перечисленных выше проблем при использовании алгоритма IsolationForest для обнаружения аномалий?