Периодический индекс нескольких источников данных Apache Solr и обновление подмножества полей без обновления документа

У меня следующая ситуация:

2 источника данных должны быть проиндексированы Apache Solr.

  1. RDBM - постоянно в наличии
  2. CSV-файл, который может время от времени передаваться в систему.

CSV файл просто обновляет 2 поля уже существующих документов в Solr.

Но у меня есть следующая проблема: кажется невозможным произвести обновление только некоторого подмножества полей с помощью DataImportHandler. Это действительно невозможно или есть какая-то хитрость?

1 ответ

Решение

Я считаю, что ваша проблема заключается в попытке "обновить" существующий документ только с двумя полями. Какую версию Solr вы используете? Частичные обновления поддерживаются только для Solr 4.x.

Вот некоторая информация о том, что такое частичные обновления и как их делать: http://wiki.apache.org/solr/Atomic_Updates

http://solr.pl/en/2012/07/09/solr-4-0-partial-documents-update/

Другие вопросы по тегам