Обработка MySQL DB и XML Hybrid в Solr Index

Проблема:

Таблица в MySQL с несколькими обычными полями и одним текстовым полем, содержащим XML

Мне нужно использовать Solr Data Import Handler для обработки этой таблицы в Solr Index.
Тем не менее, поле XML необходимо разбить на несколько других полей solr каждое

Вопрос:

  1. Возможно ли сделать это без написания собственного Трансформера? Если да, то как. Могу ли я использовать XPathEntityProcessor с моей базой данных SQL в качестве источника данных?

  2. Если я напишу собственный преобразователь, как именно я сконфигурирую его в dataConfig?

  3. Я использую старую версию solr (1.4.1), так что я могу просто добавить новую флягу с новым классом в мое веб-приложение solr?

В чем я не совсем уверен, так это в том, как мне нужно настроить data-config.xml для этого. Если у кого есть примеры, поделитесь! Благодарю.

1 ответ

Решение

Я предлагаю написать программу, которая выбирает данные из базы данных, анализирует поле данных XML и затем вставляет весь документ в индекс SOLR.

Java- интерфейс Solrj действительно прост в использовании. Самая сложная часть этого - анализ XML, но это гораздо проще и проще для тестирования.

Другие вопросы по тегам