Mongo Aggregate Сумма значений в списке словарей для всех документов

У меня есть коллекция "комментарии" следующим образом:

{
comment_id:10001
aspects:[
 {
   name:'aspectA',
   positive:2
   negative:3
   neutral:1
  },
 {
   name:'aspectB',
   positive:1
   negative:5
   neutral:3
  }
},
{
comment_id:10002
aspects:
 {
   name:'aspectA',
   positive:2
   negative:1
   neutral:2
  },
 {
   name:'aspectB',
   positive:3
   negative:4
   neutral:1
  }
}
]

количество документов в комментариях больше 100К. Я должен найти количество положительных, отрицательных и нейтральных для всех аспектов, т.е. сумма положительного, отрицательного и нейтрального для каждого аспекта из aspects поле (которое является списком диктовок, как указано выше) для всех документов. Я обнаружил, что mapreduce можно использовать для выполнения этой задачи, но я не смог найти достаточно документов для создания запроса.

Есть ли способ найти это, используя один запрос?

1 ответ

Решение

Подвести итог aspects.name Вы можете использовать следующую агрегацию:

db.comments.aggregate([{
    $unwind: "$aspects"
}, {
    $group: {
        _id: "$aspects.name",
        "positive": { $sum: "$aspects.positive" },
        "negative": { $sum: "$aspects.negative" },
        "neutral": { $sum: "$aspects.neutral" }
    }
}])

С pymongo:

from pymongo import MongoClient
import pprint

client = MongoClient('localhost', 27017)

db = client.testDB

pipeline = [
    {"$unwind": "$aspects"},
    {"$group": {
        "_id": "$aspects.name", 
        "positive": { "$sum": "$aspects.positive" }, 
        "negative": { "$sum": "$aspects.negative" }, 
        "neutral": { "$sum": "$aspects.neutral" }
        }
    }
]

pprint.pprint(list(db.comments.aggregate(pipeline)))
Другие вопросы по тегам