Описание тега shingles

"shingle" is a synonym for word-nGrams in computational linguistics and probability
1 ответ

Фильтр жетона Elasticsearch не работает

Я пытаюсь это на локальной установке 1.7.5 эластичного поиска http://localhost:9200/_analyze?filter=shingle&tokenizer=keyword&text=alkis stack я вижу это { "tokens":[ { "token":"alkis stack", "start_offset":0, "end_offset":11, "type":"word",…
20 июл '16 в 14:27
1 ответ

Solr Shingle не виден в отладочном запросе

Я пытаюсь использовать Solr, чтобы найти точные совпадения по категориям в поиске пользователя (e.g. "skinny jeans" in "blue skinny jeans"), Я использую следующее определение типа: <fieldType name="subphrase" class="solr.TextField" positionIncrem…
25 май '16 в 10:07
1 ответ

Эластичность поиска слова близость

Есть ли в asticsearch способ повысить оценку документов, в которых слова запроса находятся близко друг к другу в документе? Речь идет не только о словах, которые вместе, поскольку это может быть решено с помощью черепицы, но и о словах, которые нахо…
16 дек '15 в 22:34
2 ответа

Как объединить несколько токенов в один

В Solr при объединении токенов с использованием solr.ShingleFilterFactory он может генерировать несколько Shingles в зависимости от min/maxShingleSize и токенов для объединения. Из-за этого поиск не проходит. Как я могу объединить несколько токенов …
31 янв '16 в 03:19
1 ответ

ElasticSearch: shingles - соответствует фразе, если поле содержит точный токен

Я новичок с упругим поиском и у меня проблемы со следующим сценарием: Давайте рассмотрим, у меня есть 2 документа, который содержит только одно поле "текст""текст": "токен1 токен4" "текст": "токен2 токен3" "текст": "токен4 токен5" И, следуя тексту з…
20 окт '16 в 04:49
1 ответ

ClassNotFoundException в Hadoop

Используя Hadoop mapreduce, я пишу код для получения подстрок различной длины. Пример заданной строки "ZYXCBA" и длины 3. Мой код должен возвращать все возможные строки длины 3 ("ZYX","YXC","XCB","CBA"), длины 4("ZYXC","YXCB","XCBA"), наконец, длина…
1 ответ

Совместим ли Simple Query Search с дранкой?

Мне интересно, можно ли использовать дранку с запросом Simple Query String. Мое сопоставление для соответствующего поля выглядит следующим образом: { "text_2": { "type": "string", "analyzer": "shingle_analyzer" } } Анализатор и фильтры определяются …
17 дек '15 в 23:35
0 ответов

Solr: нулевой указатель при фасете на TextField с ShingleFilterFactory

Я отправляю следующий запрос на мой сервер Solr 7.2: "responseHeader":{ "status":500, "QTime":113, "params":{ "q":"*:*", "json.facet":"{x:{type:terms,field:SearchTextShingled,facet:{DemandUsers:\"hll(UserId)\"}}}", "rows":"0"}}, Поле SearchTextShing…
07 июн '18 в 15:37
0 ответов

Elasticsearch: нечеткость не работает с галькой

Я использую Elasticsearch 6.1, и я сталкиваюсь с проблемой, когда опрашиваю поле гальки с нечеткостью. Я скопировал этот пример: Следующий запрос работает должным образом и возвращает первый и третий документы. { "query": { "match": { "title": { "qu…
09 янв '18 в 14:59
1 ответ

Пользовательский ShingleFilter в соль

Мое требование - иметь фильтр токенов, который может производить токены, как показано ниже: Текст - "Быстрый прыжок бурой лисы" токены: "Быстрый""Быстрый коричневый""Быстрая коричневая лиса""Быстрый рывок лисы" Если я использую SingleFilterтогда я п…
01 дек '16 в 13:18
0 ответов

solr shingleFilterFactory не работает

Недавно я перешел с Solr 4 на 6. В Solr 4 shinglefilterfactory работает правильно, моя конфигурация <fieldType name="text_shingle" class="solr.TextField" positionIncrementGap="100"> <analyzer type="index"> <tokenizer class="solr.White…
16 мар '17 в 12:16
2 ответа

Elasticsearch 2.x - возвращает список черепицы

У меня есть поле "searchtext", которое я предоставил подполе "shingle", и я проиндексировал это поле searchtext с помощью фильтра shingles. Мне нужно получить список черепицы, созданной для этого поля, чтобы я мог выполнить некоторые операции с этим…
02 авг '16 в 13:56
0 ответов

Может ли Elasticsearch вернуть "успешный" размытый гонт?

TL;DR Можно ли сделать так, чтобы Elasticsearch возвращал совпавший входной ключ вместе с совпавшим документом в нечетком запросе? Пример: Допустим, у меня есть гонт "fulltext_shingle_filter":{ "type": "shingle", "min_shingle_size": 2, "max_shingle_…
07 май '16 в 13:20
2 ответа

Поиск по запросу

Я использую Solr 5.5, и у меня есть проблема, которую я надеюсь найти решение здесь. У меня есть поле, которое я создал, используя следующие настройки: <field name="exactName_noAlias_en_US" type="text_exact_query_tokenized" indexed="true" stored=…
08 сен '16 в 20:04
0 ответов

Как использовать фильтр синонимов и фильтр гальки вместе?

Я пытаюсь использовать shingle фильтр с synonym фильтр (см. код ниже). Это дает мне вывод: принудительно выполнено реализовано для на экспертизу экзаменационные испытания Слова enforced а также implemented происходят вместе так же, как testing а так…
07 сен '14 в 14:46
0 ответов

Elasticsearch: поиск текста, пропуская слова между черепицей

Когда я ищу текст "подводные корабли", я хочу, чтобы поисковый рейтинг располагал по приоритетам совпадения с "подводными кораблями". Но в моем индексе размера 2 черепицы текст будет индексироваться как {'подводные раковины', 'тонет корабли'}, но не…
27 апр '18 в 21:57
0 ответов

Интеграция нескольких индексов эластичного поиска, имеющих разные поля, для 3 ключевых черепиц

=========================================================== это мой индекс PUT /news_feeds { "настройки": { "индекс": { "number_of_shards": 10, "number_of_replicas": 1 }, "анализ": { "анализатор": { "ShingleAnalyzer": { "токенизатор": "BreadcrumbPat…
04 окт '17 в 04:41
0 ответов

Стекирование баров на основе переменной атрибута после функции equal.count

У меня есть три переменные; Сотрудник, ПМ и сайт в моей таблице. Импортированные данные в R. sitereview<-read.csv(file.choose(),header=TRUE) Образец данных рис Классифицировать данные на 6 равных интервалов, используя equal.count функция от libra…
25 сен '18 в 08:20
0 ответов

Solr MultiPhraseQuery не возвращает правильные результаты

У меня проблемы с созданием Solr поиска подстрок. Например, когда пользователь ищет "Alfa Romeo Land Car", я хочу сопоставлять только полные бренды (только "Alfa Romeo", а не "Land Rover"). Способ, которым я пытаюсь это сделать, заключается в том, ч…
29 янв '16 в 01:12
1 ответ

Сравнение черепицы для почти повторного обнаружения

Я работаю над изменяющимся кодом для сравнения почти дубликатов. Я немного застрял в коде сравнения. Это моя грубая попытка до сих пор. //shingles are already hashed integers and I'm working on the evaluation to true via the float similar parameter.…
27 июл '18 в 19:04