Как эффективно объединить несколько коллекций в одну коллекцию

У меня четыре коллекции

1.links(movieId,imdbId,tmdbId) 
2.movies(movieId,title,genres),
3.tags(userId,movieId,tag,timestamp), 
4.ratings(userId,movieId,rating,timestamp).

Теперь мне нужно собрать их в одну коллекцию следующим образом

movieId,imdbId,tmdbId,
title,genres,
u_data{[
{userId,tag,tag_timestamp,
rating,rating_timestamp}
]}

Как я могу достичь этого.

Я ссылался на ссылку1. Но не смог придумать ответ. (я использую набор данных из grouplens.org)

1 ответ

Решение

Для краткости я объединил ваши первые две коллекции. Более того, поскольку они предлагают отношение один к одному, поэтому желательно хранить его в одном документе, если ограничение в 16 МБ не является проблемой, как в вашем случае.....


db.t1.insert({
  movieId:1,
  title:"title-1",
  generes:["g1", "g2"],
  imdbId:111,
  tmdbId:112
});

db.t2.insert({
  movieId:1,
  userId:11,
  tag:"t1",
  timestamp: new Date()

});

db.t2.insert({
  movieId:1,
  userId:12,
  tag:"t2",
  timestamp: new Date()

});

db.t3.insert({
  movieId:1,
  userId:11,
  rating:2,
  timestamp: new Date()
});
db.t3.insert({
  movieId:1,
  userId:12,
  rating:3,
  timestamp: new Date()
});


db.t1.find().forEach(function(e){
  var mId = e.movieId;
  var arr = [];
  var finalOutput = {};
  finalOutput.movieId = mId;
  finalOutput.title = e.title;
  finalOutput.generes = e.generes;
  finalOutput.imdbId = e.imdbId;
  finalOutput.tmdbId = e.tmdbId;

  db.t2.find({"movieId":mId}).forEach(function(e2){
        var v = {};
        v.userId = e2.userId;
        v.tag = e2.tag;
        v.tag_ts = e2.timestamp;
        arr.push(v);
  });

for(i in arr){
    db.t3.find({movieId:mId,  userId:arr[i].userId}).forEach(function(e3){
        arr[i].rating = e3.rating;
        arr[i].rating_ts =e3.timestamp;
    });

}
  finalOutput.u_data = arr;
  printjson(finalOutput);
});

Вывод: https://www.dropbox.com/s/ijwg2xtbrwa8782/Screenshot%202015-06-22%2000.49.07.png?dl=0

Другие вопросы по тегам