Совместная фильтрация от элемента к элементу, как управлять матрицей сходства?

Question

Совместная фильтрация от элемента к элементу, как управлять матрицей сходства?

Я работаю над механизмом рекомендаций, и одна проблема, с которой я сейчас сталкиваюсь - это матрица сходства предметов, которые огромны.

Я рассчитал матрицу сходства из 20 000 элементов и сохранил их в двоичном файле, размер которого составил почти 1 ГБ. Я думаю, что это слишком большой.

Как лучше всего работать с матрицей сходства, если у вас есть так много предметов?

Любой совет!

0

recommendation-engine

Источник

user2251250 02 мар '17 в 02:31

1 ответ

Решение

Другие вопросы по тегам recommendation-engine

user7711490 09 май '17 в 16:25 2017-05-09 16:25 · Accepted Answer · 2017-05-09 16:25

На самом деле матрица сходства заключается в том, насколько объект похож на другой объект. Каждая строка состоит из соседей объекта (id строки), но вам не нужно хранить всех соседей, например, хранить только 20 соседей. Используйте lil_matrix:from scipy.sparse import lil_matrix