Mongo Aggregate Сумма значений в списке словарей для всех документов
У меня есть коллекция "комментарии" следующим образом:
{
comment_id:10001
aspects:[
{
name:'aspectA',
positive:2
negative:3
neutral:1
},
{
name:'aspectB',
positive:1
negative:5
neutral:3
}
},
{
comment_id:10002
aspects:
{
name:'aspectA',
positive:2
negative:1
neutral:2
},
{
name:'aspectB',
positive:3
negative:4
neutral:1
}
}
]
количество документов в комментариях больше 100К. Я должен найти количество положительных, отрицательных и нейтральных для всех аспектов, т.е. сумма положительного, отрицательного и нейтрального для каждого аспекта из aspects
поле (которое является списком диктовок, как указано выше) для всех документов. Я обнаружил, что mapreduce можно использовать для выполнения этой задачи, но я не смог найти достаточно документов для создания запроса.
Есть ли способ найти это, используя один запрос?
1 ответ
Решение
Подвести итог aspects.name
Вы можете использовать следующую агрегацию:
db.comments.aggregate([{
$unwind: "$aspects"
}, {
$group: {
_id: "$aspects.name",
"positive": { $sum: "$aspects.positive" },
"negative": { $sum: "$aspects.negative" },
"neutral": { $sum: "$aspects.neutral" }
}
}])
С pymongo
:
from pymongo import MongoClient
import pprint
client = MongoClient('localhost', 27017)
db = client.testDB
pipeline = [
{"$unwind": "$aspects"},
{"$group": {
"_id": "$aspects.name",
"positive": { "$sum": "$aspects.positive" },
"negative": { "$sum": "$aspects.negative" },
"neutral": { "$sum": "$aspects.neutral" }
}
}
]
pprint.pprint(list(db.comments.aggregate(pipeline)))