Описание тега indexwriter

1 ответ

Lucene IndexWriter.Close() против indexWriter.Commit()

Чем отличается IndexWriter.Close() а такжеIndexWriter.Commit() когда я хава только один случай indexWriter? Примечание. Данные, которые я собираюсь сделать индексом, очень велики, поэтому я не могу закрыть среду выполнения IndexWriter. Примечание. Я…
0 ответов

Обновление Lucene indexWriter не влияет на поиск Solr

Я реализую небольшой код для извлечения некоторых ключевых слов из индекса Lucene. Я реализовал это с помощью поискового компонента. Моя проблема заключается в том, что когда я пытался обновить Lucene IndexWriter, индекс Solr, помещенный поверх этог…
07 апр '15 в 12:30
1 ответ

IndexWriter.commit() недостаточно для изменения индекса

Я только что перенес нашу реализацию Lucene на 4.9 из 3.1, и я все еще не могу обновить документы в моем индексе без forceMerge(1) (раньше был оптимизатором). Я понимаю, что всякий раз, когда я обновляю документ, старый документ помечается как удале…
17 июл '14 в 20:19
1 ответ

Замена анализатора Lucene для поля на основе языка

Мне нужно индексировать документы на основе языка документов, и для этого я хотел бы использовать соответствующий анализатор. Можно ли как-то изменить анализатор для одного поля, не закрывая и не открывая IndexWriter, поскольку это, очевидно, дорого…
06 сен '14 в 15:51
1 ответ

Функция Python Lucene добавляет содержимое поля в документ не работает

Я индексирую страницы URL с помощью Python Lucene. У меня были некоторые ошибки при попытке добавить поля в документ. Я не уверен почему. Ошибка говорит: JavaError:,> Java stacktrace: java.lang.IllegalArgumentException: не имеет смысла иметь поле, к…
17 фев '17 в 22:55
0 ответов

Nutch Elasticsearch индексатор плагин

У меня много URL-адресов в файле nutch seed.txt, http://www.foodurl1.com,http://www.foofurl2.com т. Д., И я хочу проиндексировать все URL в ES под одним индексом, например foodindex и каждый URL как отдельный тип, например, foodindex/foodurl1, foodi…
02 сен '16 в 13:34
1 ответ

Настройка индексного преобразователя данных для отображения значений на многоуровневом языке Docin (например, JSON)

Я собираюсь разработать плагин для Apache Nutch для настройки индексатора, моя проблема в том, что в плагине, когда у вас есть доступ к NutchDocument, вы просто размещаете данные на первом уровне, а не на втором уровне. например, для "a", "location"…
06 апр '17 в 09:31
0 ответов

Solr обновление indexwriter не влияет на поиск до перезагрузки

Я реализовал плагин Solr с целью обновления некоторых полей событий Solr (фиксация, оптимизация и т. Д.). Моя проблема в том, что обновленные документы не влияют на поиск Solr, пока я не попытаюсь перезапустить Solr вручную. Не могли бы вы взглянуть…
13 июл '15 в 14:41
1 ответ

Как изменить шаблон индекса, используемый автором индекса ореха для эластичного поиска?

Из коробки средство записи индекса ореха для asticsearch генерирует индекс в asticsearch с именем, указанным в nutch-site.xml (или nutch-default.xml) в элементе свойства: <property> <name>elastic.index</name> <value>nutch<…
1 ответ

Внедрение Apache Lucene

Я читаю исходный код Apache Lucene в течение последних нескольких недель и пытаюсь выяснить метод или класс, который в первую очередь отвечает за запись списков / индексов сообщений на диск. Я много читал об индексации и пытался найти точку, где в п…
15 мар '16 в 16:31
1 ответ

Lucene IndexWriter AlreadySet Исключение

Я пытаюсь создать IndexWriter и записать в индекс Lucene. Вот мой код: public class Indexer { public static Analyzer _analyzer = new StandardAnalyzer(Lucene.Net.Util.LuceneVersion.LUCENE_48); private void WriteToIndex() { var config = new IndexWrite…
04 апр '17 в 15:51
1 ответ

NullPointerException в методе readByte SegmentIndexInput от Lucene-Appengine

Я получаю следующую ошибку трассировки при запуске Lucene. Я включаю сегмент кода, который вызвал ошибку. Конкретный проект / коннектор Lucene для Appengine КОД public static void resetAllIndicesUsingDatastore() { LOG.info("Inside resetAllIndicesUsi…
1 ответ

Как сохранить индекс Lucene без удаленных документов

Это мой первый вопрос о переполнении стека, так что пожелайте мне удачи. Я делаю процесс классификации по индексу Lucene с Java, и мне нужно обновить поле документа с именем категории. Для этой цели я использовал Lucene 4.2 с функцией средства запис…
07 ноя '14 в 16:05
0 ответов

Интеграция нескольких RAMDirectory в один каталог

Передача одного indexWriter между несколькими потоками с двумя разными RAMDirectory создает 2 новых каталога. Но indexWriter хранит индексы либо в directory1, либо directory2, либо, если мы передадим разные indexWriter каждому потоку, он будет храни…
20 сен '18 в 21:22
2 ответа

Добавление документов в Lucene Index Writer после вызова commit

Я использую Lucene 4.6. Я создал Lucene IndexWriter(в режиме CREATE MODE), добавил документы и зафиксировал его (не закрыл). Затем запустил поисковый запрос и сохранил результаты. Я снова добавил документы в индексатор, зафиксировал их и закрыл. И з…
07 авг '14 в 06:17
0 ответов

Как включить информационный поток IndexWriter на Elasticsearch

Как включить информационный поток IndexWriter? Я нашел следующий https://github.com/elastic/elasticsearch/issues/5891 но не могу найти документацию о том, как это включить.
18 апр '19 в 13:18