Настройка арументов при использовании tsclust

Я надеюсь, что кто-нибудь может мне помочь. Я только что установил пакет dtwclust в R использовать функцию tsclust как я видел людей, успешно использующих его для кластеризации данных на этом форуме (под названием dtwclust, так как функция была недавно обновлена)

Вот образец набора данных, с которым я работаю:

> print(trainset)
     ACTIVITY_X ACTIVITY_Y ACTIVITY_Z Proportion
  1:         19         21         28  1.0000000
  2:         20         14         24  1.0000000
  3:         34         35         49  1.0000000
  4:         18          5         19  1.0000000
  5:         23         27         35  1.0000000
 ---                                            
399:          9         25         27  0.5250000
400:          0          0          0  1.0000000
401:          0          0          0  1.0000000
402:          3          3          4  0.7000000
403:          0          0          0  0.9090909

Теперь мне интересно, как я должен реализовать функцию и, более точно, как должны быть отформатированы все аргументы. Я хотел бы использовать кластеризацию "нечеткого" типа, и желаемое количество кластеров k=6:

> library(dtwclust)
> train = as.matrix(trainset, byrow = T, ncol=4)
> datacluster <- dtwclust(train, type = 'fuzzy', k=6L)

Когда дело доходит до остальных аргументов, доступных для функции, они установлены в режиме "по умолчанию"? Я запустил скрипт, как указано выше, и получил разные цифры, используя:

plot(train_clust@cluster)
plot(train_clust)

Здесь я пытаюсь задаться вопросом, кластеризован ли набор данных выше в k=6. Если нет, я бы хотел поинтересоваться, как мой набор данных кластеризован, и раскрыть возможное значение k.

Мой вопрос: действительно ли остальные аргументы необходимы для такого анализа?

В таком случае, может ли кто-нибудь поставить меня на правильный путь, какие из них наиболее актуальны?

Надеюсь, этот вопрос интересен большинству участников форума. Любой вклад приветствуется!

0 ответов

Другие вопросы по тегам