Как я могу исправить ошибку MemoryError при выполнении оценки силуэта scikit-learns?

Я запускаю алгоритм кластеризации и хочу оценить результат, используя силуэтную оценку в scikit-learn. Но в scikit-learn необходимо вычислить матрицу расстояний: расстояния = pairwise_distances(X, metric=metric, **kwds)

Из-за того, что у меня данные порядка 300К, а у меня память 2ГБ, а результат не хватает памяти. И я не могу оценить результат кластеризации.

Кто-нибудь знает, как преодолеть эту проблему?

1 ответ

Установить sample_size параметр в вызове silhouette_score до некоторого значения меньше, чем 300K. При использовании этого параметра будут выбираться точки данных из X и рассчитать silhouette_score на тех, а не весь массив.

Другие вопросы по тегам