Описание тега term-vectors
0
ответов
Как получить векторную информацию о термине для всего индекса в упругом поиске, а не на уровне документа
Согласно гибкой поисковой документации, https://www.elastic.co/guide/en/elasticsearch/reference/current/docs-termvectors.html, векторы терминов могут применяться только к документам. Есть ли способ, которым я могу применить его на уровне индекса. Мо…
03 фев '17 в 08:34
2
ответа
Список терминов / pos-тегирование векторов терминов в R
У меня есть файл.csv только с одним столбцом, содержащим 1000 строк. Каждая строка содержит слово (модель мешка со словами). Теперь я хочу выяснить для каждого слова, является ли оно существительным, глаголом, прилагательным и т. Д. Я хотел бы иметь…
14 май '18 в 14:42
0
ответов
Нужен термин периодичность отчета по всему индексу
Я хотел бы получить отчет о частоте терминов для относительно большого индекса. Это фон того, что я пытаюсь сделать. Я сформулировал то, что называется группировкой, которая есть не что иное, как наборы результатов. Скажем, в моем индексе содержится…
20 окт '17 в 07:21
0
ответов
Как получить векторы терминов (частота гистограммы dist) терминов в поле совпадающих документов?
Я относительно новичок в Elasticsearch, но изучил все по векторам терминов. Я хочу получить частотное распределение количества слов выбранных терминов в выбранном поле документов, соответствующих запросу. Я не уверен, возможно ли это в ES, но если э…
17 авг '18 в 02:39
1
ответ
Elasticsearch: Доступ ко всем терминам в TermVectorResponse в плагине
Я пытаюсь получить список терминов из termvectorresponse в плагине эластичного поиска. Я хочу получить доступ ко всей статистике, которая связана с условиями, и мне сложно понять, как это сделать. После создания запроса TermVectors... TermVectorsReq…
11 апр '18 в 16:20
2
ответа
Получение векторов Lucene для найденного члена в строке
Я пытаюсь выделить термины в строке. Мой код ищет вдоль строки и ищет эквивалентные термины в индексе. Код возвращает найденные термины в порядке. Однако я хотел бы вернуть пользователю исходную строку, которая была введена пользователем с выделенны…
07 июн '18 в 09:11
1
ответ
Elasticsearch: общая частота и количество документов из данного набора документов
Я пытаюсь получить общее количество терминов и количество документов из данного набора документов, но _termvectors в asticsearch возвращает ttf и doc_count из всех документов в индексе. Есть ли способ, чтобы я мог указать список документов (идентифи…
11 янв '18 в 07:30
2
ответа
При хранении векторов терминов параметр "store" является обязательным?
Я хочу сохранить векторы терминов поля, но у меня есть сомнения в моем разуме. В документации говорится: "mappings": { "tweet": { "properties": { "text": { "type": "text", "term_vector": "with_positions_offsets_payloads", "store" : true, "analyzer" …
30 авг '17 в 04:24
0
ответов
Пользовательские векторы терминов для выделения в Elasticsearch
Я хочу использовать функции выделения Elasticsearch в результатах поиска, но не могу использовать плагин анализатора. Наш (очень нестандартный) конвейер NLP довольно тяжелый (в процессоре и памяти, а в производстве он может взаимодействовать с други…
04 янв '19 в 14:03
1
ответ
API Elvesearch termvector не работает
Я установил отображение поля заголовка для типа статьи для testindex1 индексировать следующим образом: PUT /testindex1/article/_mapping { "article": { "type": "object", "dynamic": false, "properties": { "title": { "type": "string", "store": true, "t…
07 июл '14 в 21:13
0
ответов
Kmean текстовая кластеризация с использованием скрытого семантического анализа
При выполнении кластеризации текста я понимаю, что вектор высокой размерности влияет на производительность, и нормальная тенденция заключается в применении методов уменьшения размеров до кластеризации. После этого я выбрал LSA и реализовал его с пом…
23 июн '18 в 09:43
1
ответ
Термины с несколькими словами и слово nGrams?
Я стремлюсь создать индекс, который для каждого документа будет разбивать его по словам ngrams (uni, bi и tri), а затем охватывать анализ векторов терминов для всех этих слов ngrams. Это возможно с Elasticsearch? Например, для поля документа, содерж…
09 дек '14 в 19:29
1
ответ
Как получить термин-вектор при использовании плагина ingest в ElasticSearch 5.5?
Все, У меня есть следующий код для индексации файла с помощью плагина ingest в asticsearch public class Document { public string Id { get; set; } public string Content { get; set; } public Attachment Attachment { get; set; } } var indexResponse = cl…
12 сен '17 в 22:17
0
ответов
Как получить термины по "_termvectors" в случае использования "Помощника ElasticSearch"?
Я использую "Предложение о завершении" ( https://www.elastic.co/guide/en/elasticsearch/reference/current/search-suggesters.html) в указателе ElasticSearch. Я преуспел в отображении индекса и поиске по ключевым словам. Однако иногда я хотел бы проана…
01 сен '19 в 07:53
0
ответов
Elasticsearch mtermvectors запрос API Python
В настоящее время я работаю над Elasticsearch с огромным количеством документов (около 500 КБ) в индексе. Я хочу хранить n-граммы текстовых данных каждого документа (это тоже огромно ~ каждый документ содержит 2 страницы текстовых данных) в другом и…
19 апр '20 в 23:06
2
ответа
Elasticsearch: JSON, чтобы получить частоту определенного термина
Я думаю, что это простое приложение, но я не могу найти рецепт в Интернете. Вы можете предложить JSON запрос для отправки python к экземпляру Elasticsearch, который вернет частоту определенного термина в определенном поле? Я предполагаю, что это дол…
11 фев '20 в 13:32
1
ответ
Упругий поиск Термин Полевая статистика API вектора Значение
В документации по эластичному поиску в разделе Term Vectors API Field statistics Setting field_statistics to false (default is true) will omit : document count (how many documents contain this field) sum of document frequencies (the sum of document …
05 июл '20 в 17:09
0
ответов
Получить смещения и положение искомых терминов в Solr
Выполняя поиск текста в solr, я пытаюсь получить смещение для поискового запроса в результате. например: q=id:123456+((description:"abcde"+document:"abcde"+author:"abcde"))&fl=id,codes&sort=service_date+desc В о…
21 авг '20 в 10:35
0
ответов
Elasticsearch Несколько терминов подсчитывают фильтры в нескольких документах
Мы используем Elasticsearch для поиска по нескольким терминам и фильтрации записей на основе различных условий фильтрации. Мы используем несколько ключевых слов для поиска и фильтрации записей, поэтому мне нужны некоторые другие детали вместе с резу…
12 июл '21 в 12:20
0
ответов
Производная Ли дифференциальных форм
Чем производная Ли одной формы по векторному полю отличается от производной Ли векторного поля по другому векторному полю?
17 сен '22 в 09:01