Сериализация против модели векторного пространства для minhash
Datasketch для minhash не использует модель векторного пространства, это быстрее, чем преобразование данных в модель векторного пространства для вычисления и сравнения minhash?
Ссылка на набор данных: Datasketch