Как solr выбирает метки при использовании алгоритма STC
В настоящее время я пытаюсь использовать Solr для кластеризации. Я использую алгоритм STC. Однако я не знаю, как генерируются метки кластеров. Я знаю, что используются метки узлов в дереве суффиксов, но каким образом? Какой суффикс (термины) будет выбран? Спасибо.
1 ответ
Решение
STC - это реализация алгоритма кластеризации суффиксного дерева Орен Замира. Для более подробного описания алгоритма взгляните на докторскую диссертацию Замира.