Есть ли способ выяснить, почему алгоритм определяет эти данные как выбросы?

Я использовал изолирующий лес для обнаружения выбросов, но я хочу подробнее изучить, почему он определяет эти данные как выбросы, которые я с трудом вижу непосредственно по результатам. Есть какие-нибудь способы сделать это? Или как проверить точность?

      model=IsolationForest(n_estimators=50, max_samples='auto', contamination=float(0.1), max_features=1.0)

model.fit(df)

pred = model.predict(df)

df['anomaly']=pred

outliers=df.loc[df['anomaly']==-1]

print(df['anomaly'].value_counts())

Я получил около 7000 выбросов из 70000 данных, но я не знаю, верно это или нет.

0 ответов

Другие вопросы по тегам