Совместная фильтрация от элемента к элементу, как управлять матрицей сходства?
Я работаю над механизмом рекомендаций, и одна проблема, с которой я сейчас сталкиваюсь - это матрица сходства предметов, которые огромны.
Я рассчитал матрицу сходства из 20 000 элементов и сохранил их в двоичном файле, размер которого составил почти 1 ГБ. Я думаю, что это слишком большой.
Как лучше всего работать с матрицей сходства, если у вас есть так много предметов?
Любой совет!
1 ответ
Решение
На самом деле матрица сходства заключается в том, насколько объект похож на другой объект. Каждая строка состоит из соседей объекта (id строки), но вам не нужно хранить всех соседей, например, хранить только 20 соседей. Используйте lil_matrix:from scipy.sparse import lil_matrix