mongodb在计算集合数组值时候,我们通常会想到使用$group$sum,但是如果是数组里面多个json对象,并且还需要根据条件过滤多个对象的内容该如何处理?

现在让我们来实现它,假设mongodb中有个user集合,其数据内容如下:

/* 1 */
{
    "_id" : ObjectId("5c414a6a0847e00385143003"),
    "date" : "2019-01-18 09",
    "data" : [ 
        {
            "app_platform" : "ios",
            "user" : 3028
        }, 
        {
            "app_platform" : "android",
            "user" : 4472
        }, 
    ]
}
...

现在我们需要计算date日期为"2019-01-18 09"并且app_platform的类型为"ios"的user总数

如果可以,请先思考下mongodb语句如何实现。

实现过程中有个执行非常重要,即$unwind,官方解释:

Deconstructs an array field from the input documents to output a document for each element. Each output document is the input document with the value of the array field replaced by the element.

从输入文档中解构一个数组字段,为每个元素输出一个文档。每个输出文档都是输入文档,数组字段的值由元素替换。

于是我们便想到将data数组对象分条拆开,化繁为简,mongodb语句如下:

db.getCollection('user').aggregate([
  {
      $project: { _id: 1, data: 1, date: 1}
  },
  {       
    $match: {"date": "2019-01-18 09"}
  }, 
  {
    $unwind: "$data"
  },
])

得到结果如下:

/* 1 */
{
    "_id" : ObjectId("5c414a6a0847e00385143003"),
    "date" : "2019-01-18 09",
    "data" : {
        "app_platform" : "ios",
        "user" : 3028
    }
}
/* 2 */
{
    "_id" : ObjectId("5c414a6a0847e00385143003"),
    "date" : "2019-01-18 09",
    "data" : {
        "app_platform" : "android",
        "user" : 4472
    }
}

可以看到数据由数组变成了多条文档数据,于是问题转变为计算结果的user总数,是不是觉得问题变简单了,而且我们也可以继续使用$match来过滤app_platform数据,mongodb语句如下:

db.getCollection('user').aggregate([
  {
      $project: { _id: 1, data: 1, date: 1}
  },
  {       
    $match: {"date": "2019-01-18 09"}
  }, 
  {
    $unwind: "$data"
  },
   {
    $match: {
      "data.app_platform": { $in: ["ios"]}
    },
   }
])

执行结果如下:

/* 1 */
{
    "_id" : ObjectId("5c414a6a0847e00385143003"),
    "date" : "2019-01-18 09",
    "data" : {
        "app_platform" : "ios",
        "user" : 3028
    }
}

可以看到数据已经被过滤了,如果自信观察两个$match的作用可以发现,mongodb是按顺序执行的,即$match作用于其前面的操作结果集合

让我们继续计算,此时只需要使用group与​sum对data里的user字段求和即可,mongodb语句如下:

db.getCollection('user').aggregate([
  {
      $project: { _id: 1, data: 1, date: 1}
  },
  {       
    $match: {"date": "2019-01-18 09"}
  }, 
  {
    $unwind: "$data"
  },
  {
    $match: {
      "data.app_platform": { $in: ["ios"]}
   }
  },
  {
    $group: { _id: null, "user": {$sum: "$data.user"}}
  }
])

结果如下:

/* 1 */
{
    "_id" : null,
    "user" : 7500
}

计算得出的user即我们所需要的数据。

其实所有的难点如下:

  1. 计算数组对象数据时将其转变为多条简单的数据格式,$unwind指令将问题轻松得降低了难度
  2. mongodb的执行顺序,$project$match都是顺序执行并作用于之前的操作结果

理解了这两点,相信再难的mongodb语句你也能实现。

happy coding!