LocalOutlierFactor scikit-learn
Моя цель - использовать класс LocalOutlierFactor из scikit-learn для обнаружения новизны в режиме реального времени. Это может быть достигнуто путем настройки novelty=True
в конструкторе, хотя я немного смущен параметром contamination
,
Такой параметр, который должен быть в (0, 0,5], используется для указания количества выбросов в обучающем наборе. Это имеет смысл в настройке обнаружения выбросов (т.е. когда novelty=False
передается конструктору LocalOutlierFactor), но я не могу понять его назначение в настройке обнаружения новизны.
Дело в том, что я предполагаю, что в тренировочном наборе нет выбросов, но в то же время я не могу просто установить contamination=0
потому что он должен быть в (0, 0,5]. Я знаю, что я мог бы установить его на очень маленькое значение, как 1e-16
или что-то, но для меня это похоже на хак. Так для чего он используется в настройке обнаружения новизны?