Зная, какие точки принадлежат какому кластеру в DBSCAN
Мне нужно использовать DBSCAN для объединения ставок на футбольные матчи.
Данные состоят из:
ID, хозяева поля, команда гостей, дата, время, шансы на домашний выигрыш, шансы на ничью и шансы на победу в гостях.
Мне нужны шансы на выигрыш в домашних условиях, шансы на ничью и шансы на выигрыш в гостях для кластеризации DBSCAN, потому что я хочу найти выбросы, используя кластер шума.
Однако у меня нет возможности узнать те пункты, к которым они относятся.]
Я работаю с GNU R, чтобы использовать алгоритм, используя пакет FPC
1 ответ
Из псевдокода DBSCAN:
add P to cluster C
На данный момент, вы должны хранить, какие точки принадлежат к какому кластеру, очевидно; в любой структуре данных, которую вы предпочитаете (это может быть набор или массив назначения кластера).