Есть ли способ выяснить, почему алгоритм определяет эти данные как выбросы?
Я использовал изолирующий лес для обнаружения выбросов, но я хочу подробнее изучить, почему он определяет эти данные как выбросы, которые я с трудом вижу непосредственно по результатам. Есть какие-нибудь способы сделать это? Или как проверить точность?
model=IsolationForest(n_estimators=50, max_samples='auto', contamination=float(0.1), max_features=1.0)
model.fit(df)
pred = model.predict(df)
df['anomaly']=pred
outliers=df.loc[df['anomaly']==-1]
print(df['anomaly'].value_counts())
Я получил около 7000 выбросов из 70000 данных, но я не знаю, верно это или нет.