Кластеризация тегов в крупномасштабной матрице пользовательских тегов в Matlab
Я пытаюсь сгруппировать набор тегов в огромную разреженную матрицу пользовательских тегов в Matlab, скажем:
35000 * 74000 с разреженностью 99%.
У меня, вероятно, есть два варианта:
1: Создание матрицы совпадений тегов и применение кластеризации к матрице совпадений Tag-Tag.
2. Рассматривать пользователей как функции тегов и использовать Transpose (user-tag) для кластеризации тегов.
Я понятия не имею, какой из них лучше, но у них обоих есть проблемы с большим размером пользователей и тегов.
Действительно ценю любой комментарий или предложенное решение.