Кластеризация тегов в крупномасштабной матрице пользовательских тегов в Matlab

Я пытаюсь сгруппировать набор тегов в огромную разреженную матрицу пользовательских тегов в Matlab, скажем:

35000 * 74000 с разреженностью 99%.

У меня, вероятно, есть два варианта:

1: Создание матрицы совпадений тегов и применение кластеризации к матрице совпадений Tag-Tag.

2. Рассматривать пользователей как функции тегов и использовать Transpose (user-tag) для кластеризации тегов.

Я понятия не имею, какой из них лучше, но у них обоих есть проблемы с большим размером пользователей и тегов.

Действительно ценю любой комментарий или предложенное решение.

0 ответов

Другие вопросы по тегам