Периодический индекс нескольких источников данных Apache Solr и обновление подмножества полей без обновления документа
У меня следующая ситуация:
2 источника данных должны быть проиндексированы Apache Solr.
- RDBM - постоянно в наличии
- CSV-файл, который может время от времени передаваться в систему.
CSV файл просто обновляет 2 поля уже существующих документов в Solr.
Но у меня есть следующая проблема: кажется невозможным произвести обновление только некоторого подмножества полей с помощью DataImportHandler. Это действительно невозможно или есть какая-то хитрость?
1 ответ
Решение
Я считаю, что ваша проблема заключается в попытке "обновить" существующий документ только с двумя полями. Какую версию Solr вы используете? Частичные обновления поддерживаются только для Solr 4.x.
Вот некоторая информация о том, что такое частичные обновления и как их делать: http://wiki.apache.org/solr/Atomic_Updates
http://solr.pl/en/2012/07/09/solr-4-0-partial-documents-update/