Как solr удалит документы

Я использую Solr для индексации около 70К документов, я не отправлял никаких политик удаления, но даже тогда Solr удаляет несколько документов, прежде чем завершить полный индекс из 70К документов, поэтому хотел понять, как это возможно, на каком основании Solr решает удалить документы до полной индексации.

заранее спасибо

1 ответ

Решение

Удаления, вероятно, являются дублирующими идентификаторами, что означает, что вы видите обновление документа, который был проиндексирован ранее. Обновление - это удаление + добавление, так что в итоге вы получите один удаленный документ, который учитывается в индексе.

Не существует "политики удаления", которую вы устанавливаете в Solr самостоятельно, но в зависимости от того, как вы загружаете контент Solr, среда обычно имеет какой-то способ обнаружения удаленных записей и удаления их из Solr (в DIH это deletedPkQuery).

Другие вопросы по тегам