Совместная фильтрация от элемента к элементу, как управлять матрицей сходства?

Я работаю над механизмом рекомендаций, и одна проблема, с которой я сейчас сталкиваюсь - это матрица сходства предметов, которые огромны.

Я рассчитал матрицу сходства из 20 000 элементов и сохранил их в двоичном файле, размер которого составил почти 1 ГБ. Я думаю, что это слишком большой.

Как лучше всего работать с матрицей сходства, если у вас есть так много предметов?

Любой совет!

1 ответ

Решение

На самом деле матрица сходства заключается в том, насколько объект похож на другой объект. Каждая строка состоит из соседей объекта (id строки), но вам не нужно хранить всех соседей, например, хранить только 20 соседей. Используйте lil_matrix:from scipy.sparse import lil_matrix

Другие вопросы по тегам