Настройка арументов при использовании tsclust
Я надеюсь, что кто-нибудь может мне помочь. Я только что установил пакет dtwclust
в R использовать функцию tsclust
как я видел людей, успешно использующих его для кластеризации данных на этом форуме (под названием dtwclust
, так как функция была недавно обновлена)
Вот образец набора данных, с которым я работаю:
> print(trainset)
ACTIVITY_X ACTIVITY_Y ACTIVITY_Z Proportion
1: 19 21 28 1.0000000
2: 20 14 24 1.0000000
3: 34 35 49 1.0000000
4: 18 5 19 1.0000000
5: 23 27 35 1.0000000
---
399: 9 25 27 0.5250000
400: 0 0 0 1.0000000
401: 0 0 0 1.0000000
402: 3 3 4 0.7000000
403: 0 0 0 0.9090909
Теперь мне интересно, как я должен реализовать функцию и, более точно, как должны быть отформатированы все аргументы. Я хотел бы использовать кластеризацию "нечеткого" типа, и желаемое количество кластеров k=6:
> library(dtwclust)
> train = as.matrix(trainset, byrow = T, ncol=4)
> datacluster <- dtwclust(train, type = 'fuzzy', k=6L)
Когда дело доходит до остальных аргументов, доступных для функции, они установлены в режиме "по умолчанию"? Я запустил скрипт, как указано выше, и получил разные цифры, используя:
plot(train_clust@cluster)
plot(train_clust)
Здесь я пытаюсь задаться вопросом, кластеризован ли набор данных выше в k=6. Если нет, я бы хотел поинтересоваться, как мой набор данных кластеризован, и раскрыть возможное значение k.
Мой вопрос: действительно ли остальные аргументы необходимы для такого анализа?
В таком случае, может ли кто-нибудь поставить меня на правильный путь, какие из них наиболее актуальны?
Надеюсь, этот вопрос интересен большинству участников форума. Любой вклад приветствуется!