Максимальный лимит документов для кластеризации
Есть ли лимит документов при кластеризации через плагин carrot2 с упругим поиском.
То есть мы можем кластеризовать максимум 10000 документов, используя carrot2, есть ли какое-то ограничение?
1 ответ
Carrot2 был разработан для кластеризации небольших и средних коллекций документов в режиме реального времени. Типичный диапазон - несколько сотен документов. Разумный максимум для алгоритма Lingo составляет около 1 тыс. Документов, алгоритм STC должен обрабатывать максимум около 10 тыс. Документов. Если вы хотите пойти дальше, вы можете также проверить коммерческий алгоритм Lingo3G, который подключается к Carrot2.
Сказав, что при кластеризации результатов поиска, поисковой системе сначала нужно извлечь содержимое всех документов, которые будут кластеризованы, что также может занять некоторое значительное время.