Документация для бина / ореха эластичного индекса

Существует много документации и примеров использования bin/nutch solrindex команда, но bin/nutch elasticindex Команде не хватает покрытия. Я изо всех сил пытаюсь объединить экземпляр Nutch 2.2.1 с Elasticsearch 0.90.2. Я пытался использовать этот плагин, чтобы замаскировать Elasticsearch как экземпляр Solr, но любой bin/crawl сбой заданий из-за внутренней ошибки сервера. То, что я ищу, является примером bin/crawl изменено использование Elasticsearch или подробное описание bin/nutch elasticindex команда (у натч вики нет страницы для этого). Могу ли я просто заменить каждое вхождение фразы solrindex с elasticindex свободно?

2 ответа

Решение

Я модифицировал bin/crawl удалить bin/nutch solrdedup команда, и заменил все упоминания solrindex с elasticindex,

Я не думаю, что можно заставить Nutch 2.2.x работать с Elasticsearch. Но я не вижу дополнительного преимущества от 2.2.x по сравнению с 1.8. Единственное, что Nutch 2.2.x использует Gora для сохранения просканированных страниц в базе данных по вашему выбору. Поскольку вы используете Elasticsearch для индексации результатов, я предполагаю, что вам не нужна база данных. Я сделал Nutch 1.8 с Elasticsearch 0.90.11, и вы можете найти пакет на моей учетной записи GitHub: https://github.com/andreivisan/NutchElasticsearch

Другие вопросы по тегам