Сколько столбцов может обрабатывать реализация Spark в PCA?
Можно ли, например, вычислить основные компоненты из 1 000 000 столбцов?
1 ответ
Максимальное количество столбцов составляет 65 535.
Это ограничение применяется в RowMatrix, где мы видим этот комментарий:
This cannot be computed on matrices with more than 65535 columns