Как извлечь идентификатор кластера из процесса Дирихле в PyMC3 для сгруппированных данных?

Я использую PyMC3 для кластеризации моих сгруппированных данных. В принципе, у меня есть g векторов, и я хотел бы объединить g векторов в m кластеров. Однако у меня есть две проблемы.

Во-первых, кажется, что PyMC3 может иметь дело только с одномерными данными, но не с векторами. Вторая проблема, я не знаю, как извлечь идентификатор кластера для необработанных данных. Я действительно извлекаю количество компонентов (k) и соответствующие веса. Но я не смог извлечь идентификатор, указывающий, к какому кластеру принадлежит каждая точка.

Любые идеи или комментарии приветствуются!

1 ответ

Если я вас правильно понимаю, вы пытаетесь извлечь, к какой категории (от 1 до k) относится точка данных. Однако случайная величина Дирихле создает только вектор вероятности. Это следует использовать в качестве априора для Категориального RV, и когда это будет сделано из выборки, это приведет к нумерованной категории.

Другие вопросы по тегам