Документация для бина / ореха эластичного индекса
Существует много документации и примеров использования bin/nutch solrindex
команда, но bin/nutch elasticindex
Команде не хватает покрытия. Я изо всех сил пытаюсь объединить экземпляр Nutch 2.2.1 с Elasticsearch 0.90.2. Я пытался использовать этот плагин, чтобы замаскировать Elasticsearch как экземпляр Solr, но любой bin/crawl
сбой заданий из-за внутренней ошибки сервера. То, что я ищу, является примером bin/crawl
изменено использование Elasticsearch или подробное описание bin/nutch elasticindex
команда (у натч вики нет страницы для этого). Могу ли я просто заменить каждое вхождение фразы solrindex
с elasticindex
свободно?
2 ответа
Я модифицировал bin/crawl
удалить bin/nutch solrdedup
команда, и заменил все упоминания solrindex
с elasticindex
,
Я не думаю, что можно заставить Nutch 2.2.x работать с Elasticsearch. Но я не вижу дополнительного преимущества от 2.2.x по сравнению с 1.8. Единственное, что Nutch 2.2.x использует Gora для сохранения просканированных страниц в базе данных по вашему выбору. Поскольку вы используете Elasticsearch для индексации результатов, я предполагаю, что вам не нужна база данных. Я сделал Nutch 1.8 с Elasticsearch 0.90.11, и вы можете найти пакет на моей учетной записи GitHub: https://github.com/andreivisan/NutchElasticsearch