Измерение точности алгоритма максимизации ожидания в r
Я реализовал EM-алгоритм для набора данных (групп новостей) в R, и я хотел бы измерить точность моей кластеризации.
Однако я не знаю, какие кластеры (найденные в алгоритме EM) соответствуют какой группе (приведенной в наборе данных). В таком случае, как я могу измерить точность моей кластеризации?
Насколько я понимаю, можно измерить точность, поскольку существует ряд источников, которые выражают точность в%, как показано на рисунке ниже. Это верно?