Описание тега k-means

В статистике и интеллектуальном анализе данных кластеризация k-средних - это метод кластерного анализа, целью которого является разделение n наблюдений на k кластеров, в которых каждое наблюдение принадлежит кластеру с ближайшим средним значением (наименьшими квадратами).
1 ответ

Мешок визуальных слов в Opencv

Я использую BOW в opencv для кластеризации функций переменного размера. Однако из документации opencv неясно одно, и я не могу найти причину этого вопроса: предположим: размер словаря = 100 Я использую surf для вычисления функций, и каждое изображен…
1 ответ

Как напечатать результат кластеризации в sklearn

У меня скудная матрица from scipy.sparse import * M = csr_matrix((data_np, (rows_np, columns_np))); тогда я делаю кластеризацию таким образом from sklearn.cluster import KMeans km = KMeans(n_clusters=n, init='random', max_iter=100, n_init=1, verbose…
22 апр '15 в 13:26
1 ответ

cv2.kmeans ошибка с параметрами -python

Я немного новичок в cv2, и у меня появляется следующая ошибка Сначала я получаю дескрипторы ORB изображения со следующим кодом: import cv2 img = cv2.imread('messi.jpg',0) orb = cv2.ORB_create() cv2.ocl.setUseOpenCL(False) kp, des = orb.detectAndComp…
12 ноя '16 в 21:25
1 ответ

Классификация K-средних

У меня есть набор данных, который я знаю, имеет 3 класса. Скажем, я хочу выполнить классификацию k-средних для этого набора данных с k=10. Я бы получил 10 кластеров. Как мне объединить эти 10 кластеров в 3 класса и на основании каких правил я бы это…
03 янв '17 в 00:05
1 ответ

Нечеткое k-означает - без связи, как вычисляются центроиды на следующей итерации?

Согласно Mahout in Action Как и k-средних, нечеткие k-средние циклы по всему набору данных, но вместо назначения векторов ближайшим центроидам, он вычисляет степень ассоциации точки для каждого из кластеров. Без назначения векторов ближайшим центрои…
09 апр '12 в 05:45
1 ответ

Сегментация изображения с использованием k-средних

Я пытаюсь использовать алгоритм k-средних для задачи сегментации изображения. Проблема в том, что моя программа не сегментирует изображение. Не могли бы вы помочь мне найти ошибку в моем коде? Фактически я установил число кластеров равным 32. Я испо…
1 ответ

Получение матрицы расстояний и матрицы характеристик из модели word2vec

Я сгенерировал модель word2vec, используя gensim для огромного корпуса, и мне нужно сгруппировать словари, используя k означает кластеризацию для того, что мне нужно: матрица косинусного расстояния (слово в слово, поэтому размер матрицы число_фо_сло…
24 июл '17 в 11:56
2 ответа

Применение K-средних к коэффициентам MFCC для ASR

Я разделил свой аудиосигнал на кадр 20 мс с перекрытием 10 мс. В результате у меня 500 кадров. Я рассчитал коэффициенты MFCC для каждого кадра. Я хочу сделать векторное квантование для каждого кадра, используя алгоритм K-MEAN. У меня есть 16 коэффиц…
11 мар '17 в 17:37
1 ответ

MemorError при расчете silhouette_score

Я запускаю алгоритм кластеризации KMeans на матрице с формой (190868,35). Я использую следующий код для того же: for n_clusters in range(3,10): kmeans = KMeans(init='k-means++',n_clusters=n_clusters,n_init=30) kmeans.fit(matrix) clusters = kmeans.pr…
03 июл '18 в 08:08
1 ответ

Как построить многомерные данные в кластерах

У меня есть набор данных, который имеет 6497 экземпляров, 12 атрибутов и переменную класса с именем q (качество). Значения класса могут варьироваться от 3 до 9. Данные можно скачать в формате CSV отсюда Я использую K-среднее для разделения данных на…
02 апр '15 в 14:42
1 ответ

Пример K-средних (tf.expand_dims)

В примере кода Kmeans Tensorflow, Когда используется функция 'tf.expand_dims'(вставляет размер 1 в форму тензора.) В point_expanded, centroids_expanded перед вычислением tf.reduce_sum. почему они имеют разные индексы (0, 1) во втором параметре? impo…
20 июл '17 в 07:46
1 ответ

Сравнение 2 кластерных решений с использованием кластеризации k-средних

Я экспериментирую с кластеризацией в R впервые и смотрю на основную справку по R в Интернете и пытаюсь сравнить результаты двух кластерных решений. Я скопировал и вставил скрипт, стараясь убедиться, что сначала правильно назвал соответствующие набор…
23 апр '12 в 13:42
1 ответ

Построение итераций k-средних в R

Я нашел этот код от Rentrop в ответе на другой вопрос о построении k-средних, но мне было интересно, почему он отображает только две итерации для любого данного набора данных. Есть ли способ обобщить его, чтобы остановить построение графика, когда о…
28 авг '18 в 04:03
1 ответ

Примените K-средства для Scala к каждому элементу rdd.

У меня есть большой RDD в Spark Spark, где каждый элемент является массивом из массивов. val rdd = sc.parallelize[array1[array1_1[], array1_2[], ....array1_24]], .... , array240[array240_1[], array240_2[], ....array240_24]] Все элементы разные, и я …
10 мар '16 в 06:16
1 ответ

Как визуализировать кластеризацию kmeans на многомерных данных

Я использую алгоритм кластеризации kmeans для набора данных mnist и хочу визуализировать графики после кластеризации. Пока я сделал это from mnist import MNIST mndata = MNIST('Datasets') X_train, y_train = mndata.load_training() #do the clustering k…
20 окт '17 в 07:56
1 ответ

Spark получает фактические кластероиды с StandardScaler

Я установил KMeans с масштабированными функциями, используя StandardScaler. Проблема в том, что кластерные центроиды также масштабируются. Можно ли программно получить оригинальные центероиды? import pandas as pd import numpy as np from pyspark.ml.f…
08 дек '17 в 00:20
0 ответов

array_values_database и k означает

Я использовал алгоритм K-средних. Функция получает 2 параметра: массив, который состоит из средней стоимости продукта на пользователя и целого числа, представляющего количество кластеров. ( kmeans($pin, 2) ), Я хочу положить в базу данных письмо A е…
02 сен '14 в 16:48
1 ответ

Статистика разрыва со стандартной ошибкой 1

Я реализовал Kmeans с помощью команды Scikit Learn и попробовал Elbow и Silhoutte Coefficient, чтобы найти оптимальный K. Я планирую использовать статистику гэпа для дальнейшей проверки моих результатов. def optimalK(data, nrefs=3, maxClusters=15): …
0 ответов

Использовать выбранный выпадающий параметр в качестве переменной для использования в функции Kmeans node.js

Мне нужно получить выбранное значение выпадающего из этого блока кода в файле.hbs... <div class="section-color"> <div class="jumbotron jumbotron-md center-block"> <h2>{{survey.name}} Cluster</h2> <p>This cluster was cal…
13 мар '17 в 02:30
1 ответ

R - кластерный анализ на двоичных данных блога

У меня есть веб-данные, которые похожи на образец ниже. Он просто имеет пользователя и двоичное значение для того, щелкнул ли этот пользователь по определенной ссылке на веб-сайте. Я хотел сделать кластеризацию этих данных. Моя главная цель - найти …
15 май '15 в 05:29