ElasticSearch термин агрегация
Я пытаюсь выполнить агрегацию терминов с помощью упругого поиска данных ниже с помощью следующего запроса, вывод разбивает имена на токены (см. Вывод ниже). Поэтому я попытался отобразить os_name как multi_field, и теперь я не могу сделать запрос по нему. Можно ли иметь индекс без токенов? такие как "Fedora Core"?
Запрос:
GET /temp/example/_search
{
"size": 0,
"aggs": {
"OS": {
"terms": {
"field": "os_name"
}
}
}
}
Данные:
...
{
"_index": "temp",
"_type": "example",
"_id": "3",
"_score": 1,
"_source": {
"title": "system3",
"os_name": "Fedora Core",
"os_version": 18
}
},
{
"_index": "temp",
"_type": "example",
"_id": "1",
"_score": 1,
"_source": {
"title": "system1",
"os_name": "Fedora Core",
"os_version": 20
}
},
{
"_index": "temp",
"_type": "example",
"_id": "2",
"_score": 1,
"_source": {
"title": "backup",
"os_name": "Yellow Dog",
"os_version": 6
}
}
...
Выход:
...
{
"key": "core",
"doc_count": 2
},
{
"key": "fedora",
"doc_count": 2
},
{
"key": "dog",
"doc_count": 1
},
{
"key": "yellow",
"doc_count": 1
}
...
отображение:
PUT /temp
{
"mappings": {
"example": {
"properties": {
"os_name": {
"type": "string"
},
"os_version": {
"type": "long"
},
"title": {
"type": "string"
}
}
}
}
}
2 ответа
На самом деле вы должны изменить свое отображение, как это
"os_name": {
"type": "string",
"fields": {
"raw": {
"type": "string",
"index": "not_analyzed"
}
}
},
и ваши агги должны быть изменены на:
GET /temp/example/_search
{
"size": 0,
"aggs": {
"OS": {
"terms": {
"field": "os_name.raw"
}
}
}
}
Одно решение, которое будет работать, это установить поле в not_analyzed
(Подробнее об этом читайте в документации по атрибуту "индекс").
Это решение не будет анализировать входные данные вообще, в зависимости от ваших требований, вы можете установить пользовательский анализатор, например, чтобы не разбивать слова, а использовать их строчные буквы, чтобы получить результаты без учета регистра.
curl -XDELETE localhost:9200/temp
curl -XPUT localhost:9200/temp -d '
{
"mappings": {
"example": {
"properties": {
"os_name": {
"type": "string",
"index" : "not_analyzed"
},
"os_version": {
"type": "long"
},
"title": {
"type": "string"
}
}
}
}
}'
curl -XPUT localhost:9200/temp/example/1 -d '
{
"title": "system3",
"os_name": "Fedora Core",
"os_version": 18
}'
curl -XPUT localhost:9200/temp/example/2 -d '
{
"title": "system1",
"os_name": "Fedora Core",
"os_version": 20
}'
curl -XPUT localhost:9200/temp/example/3 -d '
{
"title": "backup",
"os_name": "Yellow Dog",
"os_version": 6
}'
curl -XGET localhost:9200/temp/example/_search?pretty=true -d '
{
"size": 0,
"aggs": {
"OS": {
"terms": {
"field": "os_name"
}
}
}
}'
Выход:
{
"took" : 1,
"timed_out" : false,
"_shards" : {
"total" : 5,
"successful" : 5,
"failed" : 0
},
"hits" : {
"total" : 3,
"max_score" : 0.0,
"hits" : [ ]
},
"aggregations" : {
"OS" : {
"buckets" : [ {
"key" : "Fedora Core",
"doc_count" : 2
}, {
"key" : "Yellow Dog",
"doc_count" : 1
} ]
}
}
}