Есть ли какой-либо метод подпространственной кластеризации для работы с числовыми атрибутами?

Я пытаюсь применить некоторый метод кластеризации к моим наборам данных (с числовыми измерениями). Но я убежден, что функции имеют разные веса для разных кластеров. Я читал, что существует подход, называемый мягкой кластеризацией подпространств, который пытается идентифицировать кластеры и веса функций для каждого кластера одновременно. Однако алгоритмы, которые я нашел, применялись только к категориальным данным.

Я пытаюсь определить алгоритм числовой кластеризации мягких подпространств. Знаете ли вы, есть ли какие-либо, или как я могу адаптировать методы, изначально предназначенные для работы с категориальными данными, для работы с числовыми данными (я думаю, что было бы необходимо предложить какой-либо способ измерения релевантности каждой числовой функции в каждом кластере)?

1 ответ

Да, существуют десятки алгоритмов подпространственной кластеризации.

Вам нужно будет провести надлежащее литературное исследование, оно слишком широкое, чтобы охватить его, например, переполнение стека. Ищите (неожиданно) "подпространственную кластеризацию", но также включайте, например, "бикластеризацию".