Описание тега indexwriter
1
ответ
Lucene IndexWriter.Close() против indexWriter.Commit()
Чем отличается IndexWriter.Close() а такжеIndexWriter.Commit() когда я хава только один случай indexWriter? Примечание. Данные, которые я собираюсь сделать индексом, очень велики, поэтому я не могу закрыть среду выполнения IndexWriter. Примечание. Я…
21 фев '16 в 08:08
0
ответов
Обновление Lucene indexWriter не влияет на поиск Solr
Я реализую небольшой код для извлечения некоторых ключевых слов из индекса Lucene. Я реализовал это с помощью поискового компонента. Моя проблема заключается в том, что когда я пытался обновить Lucene IndexWriter, индекс Solr, помещенный поверх этог…
07 апр '15 в 12:30
1
ответ
IndexWriter.commit() недостаточно для изменения индекса
Я только что перенес нашу реализацию Lucene на 4.9 из 3.1, и я все еще не могу обновить документы в моем индексе без forceMerge(1) (раньше был оптимизатором). Я понимаю, что всякий раз, когда я обновляю документ, старый документ помечается как удале…
17 июл '14 в 20:19
1
ответ
Замена анализатора Lucene для поля на основе языка
Мне нужно индексировать документы на основе языка документов, и для этого я хотел бы использовать соответствующий анализатор. Можно ли как-то изменить анализатор для одного поля, не закрывая и не открывая IndexWriter, поскольку это, очевидно, дорого…
06 сен '14 в 15:51
1
ответ
Функция Python Lucene добавляет содержимое поля в документ не работает
Я индексирую страницы URL с помощью Python Lucene. У меня были некоторые ошибки при попытке добавить поля в документ. Я не уверен почему. Ошибка говорит: JavaError:,> Java stacktrace: java.lang.IllegalArgumentException: не имеет смысла иметь поле, к…
17 фев '17 в 22:55
0
ответов
Nutch Elasticsearch индексатор плагин
У меня много URL-адресов в файле nutch seed.txt, http://www.foodurl1.com,http://www.foofurl2.com т. Д., И я хочу проиндексировать все URL в ES под одним индексом, например foodindex и каждый URL как отдельный тип, например, foodindex/foodurl1, foodi…
02 сен '16 в 13:34
1
ответ
Настройка индексного преобразователя данных для отображения значений на многоуровневом языке Docin (например, JSON)
Я собираюсь разработать плагин для Apache Nutch для настройки индексатора, моя проблема в том, что в плагине, когда у вас есть доступ к NutchDocument, вы просто размещаете данные на первом уровне, а не на втором уровне. например, для "a", "location"…
06 апр '17 в 09:31
0
ответов
Solr обновление indexwriter не влияет на поиск до перезагрузки
Я реализовал плагин Solr с целью обновления некоторых полей событий Solr (фиксация, оптимизация и т. Д.). Моя проблема в том, что обновленные документы не влияют на поиск Solr, пока я не попытаюсь перезапустить Solr вручную. Не могли бы вы взглянуть…
13 июл '15 в 14:41
1
ответ
Как изменить шаблон индекса, используемый автором индекса ореха для эластичного поиска?
Из коробки средство записи индекса ореха для asticsearch генерирует индекс в asticsearch с именем, указанным в nutch-site.xml (или nutch-default.xml) в элементе свойства: <property> <name>elastic.index</name> <value>nutch<…
03 дек '15 в 12:16
1
ответ
Внедрение Apache Lucene
Я читаю исходный код Apache Lucene в течение последних нескольких недель и пытаюсь выяснить метод или класс, который в первую очередь отвечает за запись списков / индексов сообщений на диск. Я много читал об индексации и пытался найти точку, где в п…
15 мар '16 в 16:31
1
ответ
Lucene IndexWriter AlreadySet Исключение
Я пытаюсь создать IndexWriter и записать в индекс Lucene. Вот мой код: public class Indexer { public static Analyzer _analyzer = new StandardAnalyzer(Lucene.Net.Util.LuceneVersion.LUCENE_48); private void WriteToIndex() { var config = new IndexWrite…
04 апр '17 в 15:51
1
ответ
NullPointerException в методе readByte SegmentIndexInput от Lucene-Appengine
Я получаю следующую ошибку трассировки при запуске Lucene. Я включаю сегмент кода, который вызвал ошибку. Конкретный проект / коннектор Lucene для Appengine КОД public static void resetAllIndicesUsingDatastore() { LOG.info("Inside resetAllIndicesUsi…
28 май '15 в 02:20
1
ответ
Как сохранить индекс Lucene без удаленных документов
Это мой первый вопрос о переполнении стека, так что пожелайте мне удачи. Я делаю процесс классификации по индексу Lucene с Java, и мне нужно обновить поле документа с именем категории. Для этой цели я использовал Lucene 4.2 с функцией средства запис…
07 ноя '14 в 16:05
0
ответов
Интеграция нескольких RAMDirectory в один каталог
Передача одного indexWriter между несколькими потоками с двумя разными RAMDirectory создает 2 новых каталога. Но indexWriter хранит индексы либо в directory1, либо directory2, либо, если мы передадим разные indexWriter каждому потоку, он будет храни…
20 сен '18 в 21:22
2
ответа
Добавление документов в Lucene Index Writer после вызова commit
Я использую Lucene 4.6. Я создал Lucene IndexWriter(в режиме CREATE MODE), добавил документы и зафиксировал его (не закрыл). Затем запустил поисковый запрос и сохранил результаты. Я снова добавил документы в индексатор, зафиксировал их и закрыл. И з…
07 авг '14 в 06:17
0
ответов
Как включить информационный поток IndexWriter на Elasticsearch
Как включить информационный поток IndexWriter? Я нашел следующий https://github.com/elastic/elasticsearch/issues/5891 но не могу найти документацию о том, как это включить.
18 апр '19 в 13:18