Как выполнить независимую (т. е. инкрементную) кластеризацию больших данных (например, 300 ГБ) с помощью cuML (RAPIDS)? [закрыто]
Как выполнить независимую (т. е. инкрементную) кластеризацию больших данных (например, 300 ГБ) с помощью cuML?
Является ли лучшим решением постепенное уменьшение размера ( PCA , затем UMAP)? Можно ли вообще обучать UMAP вне ядра?
Его реализация k-средних , похоже, не поддерживает
partial_fit
либо?
Связанный: