Максимальный лимит документов для кластеризации

Есть ли лимит документов при кластеризации через плагин carrot2 с упругим поиском.

То есть мы можем кластеризовать максимум 10000 документов, используя carrot2, есть ли какое-то ограничение?

1 ответ

Решение

Carrot2 был разработан для кластеризации небольших и средних коллекций документов в режиме реального времени. Типичный диапазон - несколько сотен документов. Разумный максимум для алгоритма Lingo составляет около 1 тыс. Документов, алгоритм STC должен обрабатывать максимум около 10 тыс. Документов. Если вы хотите пойти дальше, вы можете также проверить коммерческий алгоритм Lingo3G, который подключается к Carrot2.

Сказав, что при кластеризации результатов поиска, поисковой системе сначала нужно извлечь содержимое всех документов, которые будут кластеризованы, что также может занять некоторое значительное время.

Другие вопросы по тегам