Использование Nutch Crawler с Solr
Могу ли я интегрировать сканер Apache Nutch с сервером Solr Index?
Редактировать:
Один из наших разработчиков придумал решение из этих постов
Ответ
да
3 ответа
Если вы хотите перейти на версию 1.0, вы можете использовать solrindex, как описано в этой статье Lucid Imagination: http://www.lucidimagination.com/blog/2009/03/09/nutch-solr/.
Nutch 2.x по умолчанию использует solr. Вы можете выполнить действия, описанные в http://wiki.apache.org/nutch/Nutch2Tutorial, или получить более подробную инструкцию в книге "Сканирование в Интернете и интеллектуальный анализ данных с помощью Apache Nutch".
Это все еще открытый вопрос. Если вы любите приключения, попробуйте применить эти патчи самостоятельно, хотя, похоже , не все так просто.