Алгоритм KMeans для извлечения модели человеческой деятельности из данных умного дома

Я работаю над проектом интеллектуального анализа данных для извлечения моделей человеческой деятельности из данных интеллектуальных счетчиков. Я не могу найти решение для KMeans или как использовать алгоритм KMeans для кластеризации.

Данные примерно такие: день делится на 48 слотов по 30 минут и активное устройство в этом слоте.

Нажмите здесь, чтобы увидеть снимок набора данных

Теперь я хочу создать кластеры, такие как время дня (утро, день, вечер, ночь), день недели, неделя и / или месяц года, сезон. Какой подход я должен использовать, чтобы получить результат с помощью KMeans?

1 ответ

KMeans не может быть использован для этого осмысленным образом очевидным образом.

Алгоритм предназначен для непрерывных переменных, где он вычисляет среднее значение (отсюда и название), а квадратичные отклонения от среднего значения должны быть минимизированы. Но ваши данные не оцениваются непрерывно. Не имеет смысла использовать средний идентификатор устройства или квадратическое отклонение.

Другие вопросы по тегам