美文网首页
Mongodb 的高级查询

Mongodb 的高级查询

作者: 千罹 | 来源:发表于2016-10-12 17:36 被阅读143次

    关键词:mongodb, mongo, project, group, aggregate, 聚合管道, 高级查询

    简介

    管道,即,前一个操作的输出(结果)是后一个操作的输入。

    鸡蛋 -> 分出鸡蛋清 -> 加入牛奶并打发 -> 奶油
    

    这就是一个管道,有四个阶段,前一个阶段的结果是后一个的输入。
    管道,可能是因为看起来像一个管道

    mongo 的管道操作

    db.collection.aggregate( [ { <stage> }, ... ] )
    

    例如,对user文档进行管道聚合:

    db.user.aggregate([
      {第一个操作},
      {第二个操作},
      {第三个操作}
    ])
    

    其中每个操作可以对应下面的任意一个:

    例如有user的库(collection)

    {
      username: 'abc',
      password: '123'
    }
    

    1. $project「投影」

    db.user.aggregate([
      {
        $project: {
          username: 1
        }
      }
    ])
    

    或者看起来是这样(为了和上面对比):

    db.user.aggregate([
      { $project: {username: 1} }
    ])
    

    查询结果:

    {
      username: 'abc'
    }
    

    1 == true 保留
    0 == false 丢弃
    下面同理

    2. $match「匹配」

    匹配出满足条件的数据项,条件与mongo查询条件一致

    db.user.aggregate([
      { $match: { username: 'abc' } }
    ])
    

    注意:如果需要按条件聚合的话,优先使用$match操作,会提高效率

    例如应该这样:

    db.user.aggregate([
      { $match: { username: 'abc' } }, // 放在首位
      { $project: { username: 1 } }
    ])
    

    不是这样:

    db.user.aggregate([
      { $project: { username: 1 } },
      { $match: { username: 'abc' } }
    ])
    

    3. $group「分组」

    对数据进行分组,我一般用于统计使用,暂时没有用作其他

    db.user.aggregate([
      { $group: {_id: '$username', sum: { $sum: 1 } } }
    ])
    

    格式化一下:

    db.user.aggregate([
      {
        $group: {
          _id: '$username', // _id 是 group 操作的必须参数,即要分组的主键
          sum_result: { $sum: 1 } // sum_result 是自定义结果字段,$sum 是操作符,这里意思是「加 1」
        }
      }
    ])
    

    稍微解释一下:
    _id 是必须的字段:

    • 后面接 1 ,意思就是有多少条数据就返回多少条结果;
    • 后面接字段名(即:"$ + 字段名" 形式),会以该字段进行分组,所有此字段的值相同的数据都将分到同一组

    sum_result 是自定义字段:

    • 结果(value)为 { $sum: 1 },即加1,也可以写成 { $sum: '$username' } 类似的字段名,如果该字段为数字,则累加数字;
    • 分到同一组的每条都将执行一次本操作,本示例得到的结果为,同名的用户个数统计

    具体使用示例参考如下

    请替换 collectionName 为自己所要操作的文档(库)名

    db.collectionName.aggregate([
      {
        $match: { // 匹配 date 字段在 start_time 和 end_time 之间的数据
          date: { $gt: start_time, $lt: end_time }
        }
      }, {
        $project: { // 投影
          user: 1,
          type_1: { // 如果 type 字段等于 1,则 type_1 等于 1,否则为 null
            $cond: [ { $eq: ['$type', 1 ] }, 1, null ]
          },
          type_2: { // 如果 type 字段等于 2,则 type_2 等于 1,否则为 null
            $cond: [ { $eq: ['$type', 2 ] }, 1, null ]
          }
        }
      }, {
        $group: {  // 分组
          _id: '$user',
          chat: {$sum: '$type_1'}, // 累加 type_1 字段
          check: {$sum: '$type_2'} // 累加 type_2 字段
        }
      }
    ]);
    

    举个栗子

    去重复后的数量

    db.collectionName.aggregate([
      {
        $match: {
          isAdded: false // 一些筛选条件
        }
      }, {
        $group: {  // 分组
          _id: '$content', // 需要去重的字段
        }
      }, {
        $group: {  // 分组
          _id: 1,
          count: {$sum: 1} // 去重之后的数量
        }
      }
    ]);
    

    相关文章

      网友评论

          本文标题:Mongodb 的高级查询

          本文链接:https://www.haomeiwen.com/subject/hcviyttx.html