Solr-Sunburnt-Nutch. в результатах отсутствует поле содержимого

Я использую Solr-Sunburnt с Джанго. Я использовал Nutch для сканирования и индексации своего сайта. Я скопировал Nutch schema.x ml в Solr.

Проблема, с которой я сталкиваюсь, заключается в том, что когда я отправляю запрос, в результатах нет поля с содержанием.

Результаты одинаковы, независимо от того, запрашиваю ли я данные из загара или напрямую из solr (из браузера:8983/solr/select).

Что мне нужно сделать, чтобы получить содержимое поля в моих результатах

PS Я нуб, когда дело доходит до поиска и решения.:)

2 ответа

Решение

Спасибо за подсказку aitchnyu22.

Так что причина content поле не возвращается в результатах; в том, что он не индексируется в первую очередь.

Причина, по которой он не индексируется, заключается в том, что файл schema.xml, который копируется с нуля в solr, имеет stored параметр content поле установлено в false по умолчанию.

Как только вы измените это на true и переиндексировать с нуля, content поле должно появиться в ваших результатах.

Так что поле должно быть

<field name="content" type="text" stored="true" indexed="true"/>

Должно ли это быть установлено для Nutch, Solr или обоих? Конечно, оно должно быть одинаковым в обоих местах, но какой компонент на самом деле использует этот флаг?

Другие вопросы по тегам