Использование Nutch Crawler с Solr

Могу ли я интегрировать сканер Apache Nutch с сервером Solr Index?

Редактировать:

Один из наших разработчиков придумал решение из этих постов

  1. Запуск Nutch и Solr
  2. Обновление для Запуск Nutch и Solr

Ответ

да

3 ответа

Если вы хотите перейти на версию 1.0, вы можете использовать solrindex, как описано в этой статье Lucid Imagination: http://www.lucidimagination.com/blog/2009/03/09/nutch-solr/.

Nutch 2.x по умолчанию использует solr. Вы можете выполнить действия, описанные в http://wiki.apache.org/nutch/Nutch2Tutorial, или получить более подробную инструкцию в книге "Сканирование в Интернете и интеллектуальный анализ данных с помощью Apache Nutch".

Это все еще открытый вопрос. Если вы любите приключения, попробуйте применить эти патчи самостоятельно, хотя, похоже , не все так просто.

Другие вопросы по тегам