Средневзвешенное значение для вложенной агрегации в Elastic Search
Я пытаюсь получить средневзвешенное значение путем агрегирования вложенного списка. Каждый документ содержит данные об одном ученике, и предметы различаются у разных учеников, и каждый предмет имеет разный вес.
Я пытаюсь вычислить средневзвешенное значение по предмету.
Мои документы имеют форму -
[{'class': '10th',
'id': '1',
'subject': [{'marks': 60, 'name': 's1', 'weight': 30},
{'marks': 80, 'name': 's2', 'weight': 70}]},
{'class': '11th',
'id': '2',
'subject': [{'marks': 43, 'name': 's10', 'weight': 40},
{'marks': 54, 'name': 's20', 'weight': 60}]},
{'class': '10th',
'id': '3',
'subject': [{'marks': 43, 'name': 's1', 'weight': 20},
{'marks': 54, 'name': 's20', 'weight': 80}]},
{'class': '10th',
'id': '4',
'subject': [{'marks': 69, 'name': 's10', 'weight': 30},
{'marks': 45, 'name': 's2', 'weight': 70}]}]
Здесь s1,s10,s2,s20 являются субъектами. Для данного класса, скажем "10-й", я пытаюсь агрегировать средневзвешенное значение.
Я делаю запрос
GET students_try/_search
{
"query": {
"match": {
"class": "10th"
}
},
"aggs": {
"subjects": {
"nested": {
"path": "subject"
},
"aggs": {
"subjects": {
"terms": {
"field": "subject.name"
},
"aggs": {
"avg_score": {
"avg": {
"field": "subject.marks"
}
},
"weighted_grade": {
"weighted_avg": {
"value": {
"field": "subject.marks"
},
"weight": {
"field": "subject.weight"
}
}
}
}
}
}
}
},
"size": 0
}
Я получаю ошибку -
{u'error': {u'col': 211,
u'line': 1,
u'reason': u'Unknown BaseAggregationBuilder [weighted_avg]',
u'root_cause': [{u'col': 211,
u'line': 1,
u'reason': u'Unknown BaseAggregationBuilder [weighted_avg]',
u'type': u'unknown_named_object_exception'}],
u'type': u'unknown_named_object_exception'},
u'status': 400}
Я не уверен, что является причиной ошибки.
1 ответ
Да, средневзвешенное значение, упомянутое Nishant, появляется только после 6.4, как упомянуто в разделе A few others
в этой ссылке подробно 6.4 релиз
Тем не менее, я придумал приведенный ниже скрипт, использующий Bucket Script Aggregation, который вычисляет взвешенное среднее значение для каждого сегмента:
POST <your_index_name>/_search
{
"size": 0,
"query": {
"match": {
"class": "10th"
}
},
"aggs": {
"subjects": {
"nested": {
"path": "subject"
},
"aggs": {
"subjects": {
"terms": {
"field": "subject.name.keyword"
},
"aggs": {
"avg_score": {
"avg": {
"field": "subject.marks"
}
},
"sum_score":{
"sum_productOfMarksAndWeight": {
"script": "doc['subject.marks'].value * doc['subject.weight'].value"
}
},
"sum_weights": {
"sum": {
"field": "subject.weight"
}
},
"weighted_avg":{
"bucket_script": {
"buckets_path": {
"sumScore": "sum_productOfMarksAndWeight",
"sumWeights": "sum_weights"
},
"script": "params.sumScore/params.sumWeights"
}
}
}
}
}
}
}
}
Если вы внимательно посмотрите на вышеприведенную агрегацию, для каждого сегмента, который я вычислил, sum of weights
а также sum of product of weights and marks
используя агрегацию суммы, а затем я использовал эти две агрегации для вычисления взвешенной агрегации.
Ниже показано, как выглядит ваш ответ. Обратите внимание, что есть предостережение, что вы также увидите sum of weights
а также sum of product of weights and marks
в результате агрегации.
отклик
{
"took": 12,
"timed_out": false,
"_shards": {
"total": 5,
"successful": 5,
"skipped": 0,
"failed": 0
},
"hits": {
"total": 3,
"max_score": 0,
"hits": []
},
"aggregations": {
"subjects": {
"doc_count": 6,
"subjects": {
"doc_count_error_upper_bound": 0,
"sum_other_doc_count": 0,
"buckets": [
{
"key": "s1",
"doc_count": 2,
"sum_weights": {
"value": 50
},
"sum_productOfMarksAndWeight": {
"value": 2660
},
"avg_score": {
"value": 51.5
},
"weighted_avg": {
"value": 53.2
}
},
{
"key": "s2",
"doc_count": 2,
"sum_weights": {
"value": 140
},
"sum_productOfMarksAndWeight": {
"value": 8750
},
"avg_score": {
"value": 62.5
},
"weighted_avg": {
"value": 62.5
}
},
{
"key": "s10",
"doc_count": 1,
"sum_weights": {
"value": 30
},
"sum_productOfMarksAndWeight": {
"value": 2070
},
"avg_score": {
"value": 69
},
"weighted_avg": {
"value": 69
}
},
{
"key": "s20",
"doc_count": 1,
"sum_weights": {
"value": 80
},
"sum_productOfMarksAndWeight": {
"value": 4320
},
"avg_score": {
"value": 54
},
"weighted_avg": {
"value": 54
}
}
]
}
}
}
}
Я надеюсь, что это поможет, дайте мне знать, если это не так, и если вы думаете, что это решает то, что вы ищете, пожалуйста, продолжайте и примите этот ответ;-)