LocalOutlierFactor scikit-learn

Моя цель - использовать класс LocalOutlierFactor из scikit-learn для обнаружения новизны в режиме реального времени. Это может быть достигнуто путем настройки novelty=True в конструкторе, хотя я немного смущен параметром contamination,

Такой параметр, который должен быть в (0, 0,5], используется для указания количества выбросов в обучающем наборе. Это имеет смысл в настройке обнаружения выбросов (т.е. когда novelty=False передается конструктору LocalOutlierFactor), но я не могу понять его назначение в настройке обнаружения новизны.

Дело в том, что я предполагаю, что в тренировочном наборе нет выбросов, но в то же время я не могу просто установить contamination=0 потому что он должен быть в (0, 0,5]. Я знаю, что я мог бы установить его на очень маленькое значение, как 1e-16 или что-то, но для меня это похоже на хак. Так для чего он используется в настройке обнаружения новизны?

0 ответов

Другие вопросы по тегам