Частота полного переиндексации на SolrCloud
Как часто мне нужно запускать полную переиндексацию на SolrCloud? Для полного переиндексации требуется более 12 часов, и мы запускаем его каждую ночь, но действительно ли это необходимо, поскольку дельта работает правильно. Новые данные поступают из расчета 2000 документов на каждую дельту за 30 секунд. Общий размер индекса: 20 ГБ
1 ответ
Если дельта работает правильно, не нужно вообще запускать переиндексацию. Исключение может быть, если вы не отключили слияние, пока индекс работает; в этом случае вам может понадобиться очень фрагментированный индексный файл, а переиндексация завершает построение полного набора в виде одного индексного файла, но обычно это не то, как настроен Solr, и если это так - это делается для причина.
Итак, если ваша дельта работает правильно и вы запускаете Solr с достаточно стандартными настройками, вы можете спокойно пропустить переиндексацию, если только вы не начинаете с пустого индекса (или у вас не возникла ситуация, когда схема изменилась). Но будьте уверены, что это также включает в себя удаления - повторный индекс, вероятно, не будет включать удаленные элементы, поэтому возникает вопрос, обрабатывает ли ваш дельта-импорт удаление также.
Ни один из наших сервисов, основанных на Solr, вообще не переиндексирует - все сделано с живыми обновлениями и приличным фактором слияния.