Скрытая семантическая индексация

Я пытаюсь выяснить, как выполнить умножение матриц, полученных после реализации SVD в LSI. Мне это нужно для моих исследований. Я хочу провести кластеризацию документов.

1 ответ

Из того, что я прочитал, после того, как вы разложите матрицу термина-документа с помощью SVD для создания [U, S, V], вам нужно будет умножить сингулярные значения, S, с левой факторной матрицей, V'. V'- ваша матрица пространства документов, которая масштабируется по единичным значениям. Косинусное сходство строк полученной матрицы должно дать вам сходство документов.

Другие вопросы по тегам