cmeans {e1071} против фанни {кластер}

Я пытался сделать нечеткую кластеризацию k-средних с набором данных размером 15'000 x 7. Сначала я попробовал функцию fanny, и для получения результата потребовалось R почти 7 часов (я также пробовал другие параметры, но всегда медленно; образец из 5000 строк занимает около получаса). С функцией cmeans это занимает 27 секунд. Чем cmeans отличается от fanny? Вот как я настроил две функции:

fn <- fanny(training, k=40, memb.exp=1.3, metric="manhattan")
cn <- cmeans(training, 40, iter.max=500, dist="manhattan", method="cmeans", m=1.3)

Получающиеся членства подобны, но не эквивалентны. Кроме того, как вычисляются центры в cmeans? В Фанни я использую следующее:

cent <- matrix(NA,40,ncol(training))
for (k in 1:40){
  cent[k,] <- colSums(fn$membership[,k]*training)/sum(fn$membership[,k]) 
}

Применяя это к cmeans, я получаю результаты, отличные от cmeans $ центров.

Большое спасибо!

0 ответов

Другие вопросы по тегам