Описание тега lucene

Термин Lucene относится к библиотеке полнотекстового поискового движка Java с открытым исходным кодом, а также ко всей экосистеме, которая выросла вокруг нее, включая lucene.net, solr, elasticsearch и zend-search-lucene.
2 ответа

KeywordAnalyzer и LowerCaseFilter/LowerCaseTokenizer

Я хочу построить свой собственный анализатор, который использует оба фильтра / токенизаторы. Я имею в виду, одно и то же поле Keyword (весь поток как один токен) и строчные Если KeywordAnalyzer использовать только, значение поля сохраняет без учета …
02 авг '12 в 17:33
1 ответ

Индексировать всю БД в один документ с помощью Lucene

Я работаю над улучшением производительности существующего приложения ASP.Net и уменьшением количества обращений к базе данных для каждого критерия поиска. Нажмите на страницу. В процессе я пытаюсь реализовать Lucene.Net . но странно то, что я пытаюс…
13 ноя '14 в 09:35
2 ответа

Hibernate Search не индексирует встроенные коллекции должным образом

В настоящее время я работаю над проектом, который включает использование Hibernate Search. В настоящее время проект использует чистый SQL для своих поисков, и мы хотели бы вместо этого использовать текстовый поиск (необходимость знать и правильно пи…
22 июн '11 в 21:17
2 ответа

Elasticsearch: сравнение дат (безболезненный сценарий)

Мое отображение createdAt: "createdAt": { "type": "date" }, Я вставляю даты как это: POST logs/_doc/_bulk?pretty {"index":{"_id":1}} {"createdAt":"2018-05-01T07:30:00Z","value":"on"} Когда я запрашиваю документы GET logs/_doc/_search Это показывает …
1 ответ

Android Lucene OutOmMeoryExceptoin

У меня есть индекс Lucene с 50571 документом из 1740 книг. У меня есть два процесса, которые создают этот индекс. Первый процесс заключается в создании индекса документа устройства по документу. Этот процесс очень медленный. Другой процесс - создать…
14 сен '12 в 17:07
0 ответов

Elasticsearch при обновлении одного индекса также должен обновлять другие значения индекса

Мне нужно обновить поле lat_long в индексе 'ADDRESS' при обновлении значений в индексе 'USER'. Есть ли способ вызвать событие в asticsearch внутренне со стороны сервера для обновления индекса адреса при обновлении индекса USERinx?
08 ноя '16 в 06:18
1 ответ

Elasticsearch - Почему я не получаю те же результаты поиска после обновления документа?

Вот что я делаю: Сначала я делаю поиск и получаю некоторые документы curl -XPOST index/type/_search { "query" : { "match_all": {} }, "size": 10 } Затем я обновляю один из документов, приведенных в поиске curl -XPOST index/type/_id/_update { "doc" : …
05 окт '16 в 16:36
1 ответ

Elasticsearch: IllegalArgumentException

Я использовал приведенный ниже запрос, чтобы соответствовать всем документам { "query": { "custom_score": { "query": { "query_string": { "query": "*" } }, "script": "_score" } } } Но, к сожалению, я получаю ошибку ниже { "took": 1515, "timed_out": f…
13 сен '13 в 10:11
1 ответ

Elastic Search - передайте синоним при создании индекса

Я пытаюсь использовать функцию синонимов в упругом поиске Ниже моя упругая конфигурация поиска <elasticsearch:node-client id="client" local="true"/> <bean name="elasticsearchTemplate" class="org.springframework.data.elasticsearch.core.Elast…
1 ответ

Apache Lucene против Google Search Appliance

Кто-нибудь сталкивался с особенностями Apache Lucene? Я слышал, что он даже сопоставим с Google Search Appliance (GSA). Я искал определенное сравнение между этими двумя, если возможно? Эти сравнения, доступные онлайн, довольно расплывчаты.
24 май '13 в 12:23
0 ответов

Функция шкалы lucene-solr перезапускает minTarget, имея одинаковые оценки для всех элементов в наборе результатов

Я хочу нормализовать оценку для конкретного запроса относительно набора результатов для запроса и отфильтровать только более релевантные результаты на основе порога. Я использую функцию шкалы для нормализации результатов оценки, как показано ниже, и…
08 ноя '18 в 08:25
1 ответ

lucene поиск по всем полям

Этот код индексирует массив строк в поля for (int i =0; i < fileFields.length; i++) { Field field = new Field("field" + String.valueOf(i + 1), fileFields[i], Field.Store.YES,Field.Index.NOT_ANALYZED); document.add(field); } Я хочу выполнить поиск…
06 окт '15 в 05:00
1 ответ

Невозможно отсортировать результаты Solr Geospatial search

Как мы можем сделать так, чтобы Solr 3.6.1 возвращал результаты геопространственного поиска, отфильтрованные по bbox и отсортировано по расстоянию? Я пытался добавить &sort=geodist() asc на URL, как указано в документации Solr, но я получаю сооб…
28 сен '12 в 03:11
1 ответ

Elastic Search - Sort - переключение между целочисленными полями при условии 0

Скажем, у меня есть два поля двойного типа данных с именами priority1 и priority2. Нам нужно отсортировать по приоритету 1, но когда приоритет 1 равен 0, выберите поле приоритет 2. Пример - Document 1 - priority1 : 8.5, priority2 : 9.0 Document 2 - …
26 сен '14 в 07:46
1 ответ

Предварительно выделить место на диске для lucene.net?

При добавлении большого количества записей в базу данных Lucene.Net размер файлов данных постепенно увеличивается. Это приводит к нежелательному побочному эффекту, который вызывает большую фрагментацию диска в системах, которые имеют много баз данны…
08 окт '12 в 15:16
6 ответов

Нужен совет по оптимизации запросов Lucene

Я работаю над приложением поиска работы через Интернет, используя Lucene.User. На моем сайте можно искать вакансии, которые находятся в радиусе 100 миль, скажем, от "Бостона, Массачусетса" или любого другого места. Кроме того, мне нужно показать рез…
02 янв '09 в 06:07
1 ответ

Lucene.net 3.0.5 - возможно чтение незафиксированных изменений?

Я индексирую последовательность документов с помощью IndexWriter и фиксирую изменения в конце итерации. Однако на полпути итерации я хотел бы "запросить" незафиксированные изменения, используя IndexSearcher. Возможно ли это с текущей версией Lucene.…
30 дек '15 в 15:58
0 ответов

Тика не может правильно читать текст из файла PDF

Я новичок в Apache Тика. У меня есть два файла PDF с другим шрифтом, но tika не может правильно читать, у одного шрифт Shruti, который правильно читается с помощью tika, но у другого файла шрифт lmg-rupen, который не читается правильно с tika, есть …
30 июл '16 в 16:56
1 ответ

Запрос пространственного фасета Hibernate Search работает сначала 5 раз, затем возвращает только 5-й результат

У меня есть индекс автомобилей для продажи в различных географических точках, и я ищу, чтобы найти всех отдельных производителей с количеством автомобилей, которые они имеют в радиусе в определенном месте и по определенной цене. Я написал код запрос…
03 июл '17 в 11:43
1 ответ

Исключение Solr часто возникает на сервере org.mortbay.jetty.EofException java.net.SocketException: Сломанный канал

Это исключение часто возникает, когда система вставляет новую запись в БД и обновляет индекс solr, есть ли у кого-нибудь такая же проблема? как этого избежать? Mar 29, 2012 6:26:59 PM org.apache.solr.core.SolrCore execute INFO: [] webapp=/solr path=…
30 мар '12 в 01:31