Solrcloud и обработчик импорта данных

Question

Solrcloud и обработчик импорта данных

Я планирую обновить Solr с одного экземпляра до облачного. В настоящее время у меня есть 5 ядер, и каждое настроено с обработчиком импорта данных. Я развернул веб-приложение вместе с solr.war внутри папки tomcat, которая будет периодически запускать полный импорт и дельта-импорт в соответствии с потребностями моего проекта.

Теперь я планирую создать 2 осколка для этого приложения, сохраняя половину моих 5-ядерных данных в каждом осколке. Я не понимаю, как DIH будет работать в SolrCloud?

Это нормально, если я начну полное индексирование с обоих шардов?
Или мне нужно сделать полную индексацию только из одного шарда?

Архитектура будет выглядеть ниже

1

java solr apache-zookeeper solrcloud solr4

Источник

user2369476 22 июн '15 в 11:50

2 ответа

Другие вопросы по тегам java solr apache-zookeeper solrcloud solr4

user2369476 10 июл '15 в 11:16 2015-07-10 11:16 · Answer 1 · 2015-07-10 11:16

После долгих поисков и поисков я наконец решил использовать DIH следующим образом. Пожалуйста, дайте мне знать ваши комментарии, если вы чувствуете, что будут проблемы с этой архитектурой.

0

Источник

user2369476 10 июл '15 в 11:16

user131309 26 июн '15 в 00:00 2015-06-26 00:00 · Answer 2 · 2015-06-26 00:00

Все зависит от того, как вы создаете свое облачное решение: с использованием составного идентификатора или неявной маршрутизации. Использование составной маршрутизации идентификаторов поможет распределить документы по всем доступным осколкам. Вы можете начать импорт с любого облачного узла Solr. В итоге облачная среда будет содержать импортированные индексы документов, распределенные по всем шардам. Если вы используете неявную маршрутизацию, вы можете контролировать, где хранить индекс каждого документа. Вам не нужно использовать DIH. В качестве альтернативы вы можете написать небольшое приложение, которое использует клиент Solr для заполнения индекса, что дает вам больше контроля.