Как выполнить независимую (т. е. инкрементную) кластеризацию больших данных (например, 300 ГБ) с помощью cuML (RAPIDS)? [закрыто]

Как выполнить независимую (т. е. инкрементную) кластеризацию больших данных (например, 300 ГБ) с помощью cuML?

Является ли лучшим решением постепенное уменьшение размера ( PCA , затем UMAP)? Можно ли вообще обучать UMAP вне ядра?

Его реализация k-средних , похоже, не поддерживает partial_fit либо?

Связанный:

0 ответов

Другие вопросы по тегам