Описание тега cosine-similarity
Косинусное сходство - это мера сходства между двумя векторами внутреннего пространства продукта, которая измеряет косинус угла между ними. Это популярная мера сходства между двумя векторами, поскольку она вычисляется как нормализованное скалярное произведение двух векторов, которое можно вычислить с помощью простых математических операций.
1
ответ
Cosine Сходство с Lucene только для документов, которые соответствуют
Lucene - это система обратной индексации, насколько я понимаю, ее сила заключается в том, что она будет сравнивать запрос только с документами, которые хотя бы соответствуют токену. По сравнению с наивным подходом, когда запрос сравнивается с каждым…
07 сен '15 в 17:18
0
ответов
Эффективное по памяти решение для расчетов сходства предметов - данные о покупках
Я работаю над рекомендациями продукта. Мой набор данных выглядит следующим образом (пример, полный из которых содержит более 110 000 строк и более 80000 уникальных product_id): user_id product_id 0 0E3D17EA-BEEF-493 12909837 1 0FD6955D-484C-4FC8-8C3…
29 авг '18 в 10:46
1
ответ
Как рассчитать взвешенное сходство с scipy.spatial.distance.cosine?
Из определения функции: https://docs.scipy.org/doc/scipy/reference/generated/scipy.spatial.distance.cosine.html scipy.spatial.distance.cosine (u, v, w = нет) но мои коды получили некоторые ошибки: from scipy import spatial d1 = [3,5,5,3,3,2] d2 = [1…
19 июн '18 в 11:09
1
ответ
sklearn косинусное сходство:: AttributeError: у объекта 'module' нет атрибута 'metrics'
ur[5][8]= [[0,3,4,0,0,0,5,0], [4,5,0,0,0,0,3,0], [0,4,0,3,0,0,1,4], [2,0,5,0,0,0,3,0], [0,0,0,5,0,0,0,4]] 0 означает, что фильм не оценен. Я хочу предсказать рейтинг фильма без рейтинга для каждого пользователя, используя косинусное сходство, и посл…
18 авг '17 в 17:24
0
ответов
Эффективный способ вычисления косинусного сходства между матрицей и вектором различной длины?
Я пытаюсь вычислить косинусное сходство между матрицей векторов и вектором. Я использую эту функцию: matrix_example = [list([u'phase', u'nepal', u'formulation', u'workshop', u'janakpur', u'kamala', u'river', u'system', u'stakeholder', u'dhanusa']) l…
30 янв '19 в 17:09
0
ответов
Ручной косинус сходство Matlab
Я новичок в matlab и data mining. Я вычислю сходство между двумя узлами, используя косинусное расстояние. У меня есть данные, данные похожи на: feature 1 | feature 2 | feature 3 узел 1 | 2 1 3узел 2 | 1 0 1узел 3 | 4 3 2узел 4 | 0 2 1 Если я использ…
15 окт '17 в 17:37
2
ответа
Создать случайный вектор с учетом косинуса сходства
В основном, учитывая некоторый вектор v, я хочу получить другой случайный вектор w с некоторым косинусным сходством между v и w. Есть ли способ получить это в Python? Пример: для простоты у меня будет 2D вектор v [3,-4]. Я хочу получить случайный ве…
21 окт '18 в 15:05
1
ответ
Почему уменьшение размерности улучшает неконтролируемую кластеризацию киноплакатов?
Я пишу статью, в которой я пытаюсь группировать постеры фильмов на основе их визуальных особенностей. Цель состоит в том, чтобы объединить постеры фильмов, которые выглядят одинаково. Чтобы получить количественное описание того, как "выглядят" плака…
30 окт '18 в 14:59
0
ответов
Алгоритм Роккио - Можем ли мы ожидать, что у документа будет высокий показатель косинуса после того, как он будет помечен как нерелевантный
Я тестирую реализацию алгоритма Роккио. Первоначальные результаты в порядке. Но когда я отмечаю документ как не релевантный (хотя это важно, для тестирования я отмечаю его как не релевантный), я должен ожидать, что документ будет удален из результат…
12 окт '18 в 02:14
1
ответ
Косинусное сходство между запросом и документами
Так что я борюсь за концепцию поиска информации. Это касается косинусного сходства документов, задаваемых запросом. Я манипулирую около 1000 файлов, чтобы сгенерировать частотную матрицу терминов с помощью [docID x term]. Я сгенерировал эту матрицу,…
09 ноя '18 в 02:10
1
ответ
Как найти косинусное сходство между двумя текстовыми документами с использованием Java?
Мне нужно сравнить большое количество твитов, содержащих определенный хэштег, чтобы отобразить твит с самым высоким содержанием. Для того же, мне нужно найти парное косинусное сходство между каждым из них и отобразить твит с наибольшим парным косину…
28 мар '17 в 16:58
0
ответов
Python: Как эффективно получить матрицу сходства косинусов
Есть 2 массива, содержащих 30000 векторов и 50000 векторов соответственно. Item_array = [item1,item2,...,item30000] User_array = [user1,user2,...,user50000] Каждый вектор в массиве является значением tfidf с использованием Gensim. Например: Item_arr…
13 июл '17 в 22:20
1
ответ
Вычисление косинусного сходства двух векторов разного размера
У меня есть 2 вопроса, Я сделал вектор из документа, узнав, сколько раз каждое слово появлялось в документе. Это правильный способ сделать вектор? Или я должен сделать что-то еще? Используя вышеописанный метод, я создал векторы из 16 документов, кот…
19 сен '12 в 15:00
3
ответа
Косинусное сходство документов с весами
Я пытаюсь найти косинусное сходство двух документов, представленных следующим образом: d1: [(0,1), (3,2), (6, 1)] d2: [(1,1), (3,1), (5,4), (6,2)] где каждый документ представляет собой вектор веса темы, где темы - первый элемент в кортеже, а вес - …
03 ноя '16 в 17:53
1
ответ
Взвешенное косинусное сходство на разреженных векторах
Я пытаюсь вычислить сходство между двумя разреженными векторами, используя косинусное сходство. который работает нормально. Тем не менее, я хотел бы сделать дополнительный шаг - ввести взвешивание для каждого индекса вектора. например, где сравнивае…
02 сен '16 в 13:16
1
ответ
Поиск наиболее похожих предметов по евклидову и косинусу
Как мне найти сходство в R? В частности, метриками сходства, которые меня больше всего волнуют, являются косинус и значение KNN-#. Я предполагаю, что ключевым аспектом этого является то, что данные будут в удобной для меня форме. Например, используя…
17 ноя '17 в 01:15
1
ответ
Вычисление угла между векторами с использованием вектора в качестве опорной точки:
Я пытался найти быстрый алгоритм вычисления всех углов между n векторами, которые имеют длину х. Например, если x=3 и n=4, мои данные будут выглядеть примерно так: A: [1,2,3]B: [2,3,4]C: [...]D: [...] Мне было интересно, допустимо ли найти угол межд…
06 ноя '15 в 05:45
0
ответов
Сходство косинусов с помощью tf-idf: Sklearn
Я пытаюсь найти сходство косинусов между двумя сериями, используя tf-idf, используя sklearn. Но есть случай, когда даже строки не похожи, но их косинусное сходство равно 1. Вот код: from sklearn.metrics.pairwise import cosine_similarity series1 = df…
27 ноя '18 в 10:04
0
ответов
Различные функции сходства косинусов дают разные результаты для векторов Word2vec
Я пытаюсь реализовать функцию сходства / расстояния Cosine, аналогичную gensim.similarity функция или cosine функция (от scipy.spatial.distance). Вот пример: x = model.wv['best'] y = model.wv['amber'] print(cosine(x,y)) Результат равен '1,0', соглас…
22 мар '18 в 09:05
0
ответов
Есть ли какой-нибудь пакет в R, чтобы использовать jaccard или косинусное расстояние для кластеризации k-medoid?
Я использую функцию pam в упаковке cluster для разделения вокруг медоидов. pam(x, k, diss = inherits(x, "dist"), metric = "euclidean", medoids = NULL, stand = FALSE, cluster.only = FALSE, do.swap = TRUE, keep.diss = !diss && !cluster.only &a…
17 ноя '17 в 21:24