Результаты этапа совпадения Mongodb $match с ошибкой тайм-аута

В users_table есть около 9000 пользователей, а у пользователя с наибольшим количеством заказов около 300 заказов.

Когда я запрашиваю с кодом ниже, все работает нормально, пока $match этап. Это занимает более 20 секунд, поэтому запрос выводится с ошибкой тайм-аута. Я знаю, что могу увеличить время, чтобы избавиться от этой ошибки, но я хочу знать, ПОЧЕМУ простой $match этап занимает очень много времени?

db.getCollection('users_table').aggregate([
{
// user.id field is related to order.user_id field 
  '$lookup': {
    'from': 'orders_table',
    'localField': 'id',
    'foreignField': 'user_id',
    'as': 'orders'
  }
},
{
// I keep user.id and the delivered orders
  '$project': {
    'id': 1,
    'filtered_orders': {
      '$filter': {
        'input': '$orders',
        'as': 'order',
        'cond': {'$eq':['$$order.status', 'delivered']}
      }
    }
  }
},
{
// get rid of _id and get delivered order count as well as user.id
  '$project': {
    '_id': 0,
    'id': 1,
    'order_count': {'$size': '$filtered_orders'}
  }
},
{
// get order_count field between 200 and 350
  '$match': {
    'order_count' : {'$gte': 200, '$lte': 350}
  }
}
])

2 ответа

Решение

Рассмотрите возможность добавления индексов

db.users_table.createIndex( { id: 1 }, { background: true } )
db.orders_table.createIndex( { user_id: 1 }, { background: true } )

Попробуйте этот запрос. также убедитесь, что 'status' в orders_table проиндексирован

db.getCollection('orders_table').aggregate([
  {
    '$match': {
      'status' : 'delivered'
    }
  },
  {
    $group:{
      _id:'$user_id',
      order_count: { $sum: 1 }
      user_id:'$user_id',
    }
  },
  {
    '$match': {
      'order_count' : {'$gte': 200, '$lte': 350}
    }
  },
])

Другие вопросы по тегам