Как solr выбирает метки при использовании алгоритма STC

В настоящее время я пытаюсь использовать Solr для кластеризации. Я использую алгоритм STC. Однако я не знаю, как генерируются метки кластеров. Я знаю, что используются метки узлов в дереве суффиксов, но каким образом? Какой суффикс (термины) будет выбран? Спасибо.

1 ответ

Решение

STC - это реализация алгоритма кластеризации суффиксного дерева Орен Замира. Для более подробного описания алгоритма взгляните на докторскую диссертацию Замира.

Другие вопросы по тегам