Описание тега term-vectors

0 ответов

Как получить векторную информацию о термине для всего индекса в упругом поиске, а не на уровне документа

Согласно гибкой поисковой документации, https://www.elastic.co/guide/en/elasticsearch/reference/current/docs-termvectors.html, векторы терминов могут применяться только к документам. Есть ли способ, которым я могу применить его на уровне индекса. Мо…
03 фев '17 в 08:34
2 ответа

Список терминов / pos-тегирование векторов терминов в R

У меня есть файл.csv только с одним столбцом, содержащим 1000 строк. Каждая строка содержит слово (модель мешка со словами). Теперь я хочу выяснить для каждого слова, является ли оно существительным, глаголом, прилагательным и т. Д. Я хотел бы иметь…
14 май '18 в 14:42
0 ответов

Нужен термин периодичность отчета по всему индексу

Я хотел бы получить отчет о частоте терминов для относительно большого индекса. Это фон того, что я пытаюсь сделать. Я сформулировал то, что называется группировкой, которая есть не что иное, как наборы результатов. Скажем, в моем индексе содержится…
20 окт '17 в 07:21
0 ответов

Как получить векторы терминов (частота гистограммы dist) терминов в поле совпадающих документов?

Я относительно новичок в Elasticsearch, но изучил все по векторам терминов. Я хочу получить частотное распределение количества слов выбранных терминов в выбранном поле документов, соответствующих запросу. Я не уверен, возможно ли это в ES, но если э…
17 авг '18 в 02:39
1 ответ

Elasticsearch: Доступ ко всем терминам в TermVectorResponse в плагине

Я пытаюсь получить список терминов из termvectorresponse в плагине эластичного поиска. Я хочу получить доступ ко всей статистике, которая связана с условиями, и мне сложно понять, как это сделать. После создания запроса TermVectors... TermVectorsReq…
11 апр '18 в 16:20
2 ответа

Получение векторов Lucene для найденного члена в строке

Я пытаюсь выделить термины в строке. Мой код ищет вдоль строки и ищет эквивалентные термины в индексе. Код возвращает найденные термины в порядке. Однако я хотел бы вернуть пользователю исходную строку, которая была введена пользователем с выделенны…
07 июн '18 в 09:11
1 ответ

Elasticsearch: общая частота и количество документов из данного набора документов

Я пытаюсь получить общее количество терминов и количество документов из данного набора документов, но _termvectors в asticsearch возвращает ttf и doc_count из всех документов в индексе. Есть ли способ, чтобы я мог указать список документов (идентифи…
11 янв '18 в 07:30
2 ответа

При хранении векторов терминов параметр "store" является обязательным?

Я хочу сохранить векторы терминов поля, но у меня есть сомнения в моем разуме. В документации говорится: "mappings": { "tweet": { "properties": { "text": { "type": "text", "term_vector": "with_positions_offsets_payloads", "store" : true, "analyzer" …
30 авг '17 в 04:24
0 ответов

Пользовательские векторы терминов для выделения в Elasticsearch

Я хочу использовать функции выделения Elasticsearch в результатах поиска, но не могу использовать плагин анализатора. Наш (очень нестандартный) конвейер NLP довольно тяжелый (в процессоре и памяти, а в производстве он может взаимодействовать с други…
1 ответ

API Elvesearch termvector не работает

Я установил отображение поля заголовка для типа статьи для testindex1 индексировать следующим образом: PUT /testindex1/article/_mapping { "article": { "type": "object", "dynamic": false, "properties": { "title": { "type": "string", "store": true, "t…
07 июл '14 в 21:13
0 ответов

Kmean текстовая кластеризация с использованием скрытого семантического анализа

При выполнении кластеризации текста я понимаю, что вектор высокой размерности влияет на производительность, и нормальная тенденция заключается в применении методов уменьшения размеров до кластеризации. После этого я выбрал LSA и реализовал его с пом…
1 ответ

Термины с несколькими словами и слово nGrams?

Я стремлюсь создать индекс, который для каждого документа будет разбивать его по словам ngrams (uni, bi и tri), а затем охватывать анализ векторов терминов для всех этих слов ngrams. Это возможно с Elasticsearch? Например, для поля документа, содерж…
09 дек '14 в 19:29
1 ответ

Как получить термин-вектор при использовании плагина ingest в ElasticSearch 5.5?

Все, У меня есть следующий код для индексации файла с помощью плагина ingest в asticsearch public class Document { public string Id { get; set; } public string Content { get; set; } public Attachment Attachment { get; set; } } var indexResponse = cl…
12 сен '17 в 22:17
0 ответов

Как получить термины по "_termvectors" в случае использования "Помощника ElasticSearch"?

Я использую "Предложение о завершении" ( https://www.elastic.co/guide/en/elasticsearch/reference/current/search-suggesters.html) в указателе ElasticSearch. Я преуспел в отображении индекса и поиске по ключевым словам. Однако иногда я хотел бы проана…
01 сен '19 в 07:53
0 ответов

Elasticsearch mtermvectors запрос API Python

В настоящее время я работаю над Elasticsearch с огромным количеством документов (около 500 КБ) в индексе. Я хочу хранить n-граммы текстовых данных каждого документа (это тоже огромно ~ каждый документ содержит 2 страницы текстовых данных) в другом и…
19 апр '20 в 23:06
2 ответа

Elasticsearch: JSON, чтобы получить частоту определенного термина

Я думаю, что это простое приложение, но я не могу найти рецепт в Интернете. Вы можете предложить JSON запрос для отправки python к экземпляру Elasticsearch, который вернет частоту определенного термина в определенном поле? Я предполагаю, что это дол…
11 фев '20 в 13:32
1 ответ

Упругий поиск Термин Полевая статистика API вектора Значение

В документации по эластичному поиску в разделе Term Vectors API Field statistics Setting field_statistics to false (default is true) will omit : document count (how many documents contain this field) sum of document frequencies (the sum of document …
05 июл '20 в 17:09
0 ответов

Получить смещения и положение искомых терминов в Solr

Выполняя поиск текста в solr, я пытаюсь получить смещение для поискового запроса в результате. например: q=id:123456+((description:"abcde"+document:"abcde"+author:"abcde"))&fl=id,codes&sort=service_date+desc В о…
21 авг '20 в 10:35
0 ответов

Elasticsearch Несколько терминов подсчитывают фильтры в нескольких документах

Мы используем Elasticsearch для поиска по нескольким терминам и фильтрации записей на основе различных условий фильтрации. Мы используем несколько ключевых слов для поиска и фильтрации записей, поэтому мне нужны некоторые другие детали вместе с резу…
12 июл '21 в 12:20
0 ответов

Производная Ли дифференциальных форм

Чем производная Ли одной формы по векторному полю отличается от производной Ли векторного поля по другому векторному полю?
17 сен '22 в 09:01