美文网首页
MongoDB查询

MongoDB查询

作者: 常怀德 | 来源:发表于2020-11-17 11:05 被阅读0次

    mongodb中aggregate()方法统计查询

    db.getCollection('wx_content').aggregate([{group : {_id : "uid", num_tutorial : {$sum : 1}}}])

    类似于SQL中

    select uid, count(*) from wx_content group by uid
    

    一、前言

    MongoDB作为NoSQL(NoSQL = Not Only SQL 意即"不仅仅是SQL"。),由 C++ 语言编写。旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。

    传统的关系数据库(如mysql)一般由数据库(database)、表(table)、记录(record)三个层次概念组成,MongoDB是由数据库(database)、集合(collection)、文档对象(document)三个层次组成。

    MongoDB提供了很丰富的查询条件,因其接入Javascrip风格语法,支持for,while,next,hasNext,forEach,toArray,findOne,limit等语句。

    本文主要收集整理MongoDB的查询方式。

    二、查询方式

    MongoDB查询可以在启动服务后进入shell界面进行,也可以在客户端查询窗口进行。

    常用命令

    show dbs -- 查看数据库列表

    use admin --创建admin数据库,如果存在admin数据库则使用admin数据库

    db ---显示当前使用的数据库名称

    db.getName() ---显示当前使用的数据库名称

    db.dropDatabase() --删当前使用的数据库

    db.repairDatabase() --修复当前数据库

    db.version() --当前数据库版本

    db.getMongo() --查看当前数据库的链接机器地址

    db.stats() 显示当前数据库状态,包含数据库名称,集合个数,当前数据库大小 ...

    db.getCollectionNames() --查看数据库中有那些个集合(表)

    show collections --查看数据库中有那些个集合(表)

    db.person.drop() --删除当前集合(表)person

    三、基本查询

    find查询

    MongoDB 中查询文档使用 find() 方法。find() 方法以非结构化的方式来显示所要查询的文档, 查询数据的语法格式如下:

    db.collection.find(query, projection)

    query 为可选项,设置查询操作符指定查询条件;projection 也为可选项,表示使用投影操作符指定返回的字段,如果忽略此选项则返回所有字段。

    # 查询users集合中所有内容
    db.users.find()
    

    向查询文档中添加键值对时,意味着限制查询条件。

    db.users.find({name:'alice'});
    
    db.users.find({age:20});
    
    # 查询名为alice且年龄为20的用户
    db.users.find({name:'alice', age:20});
    

    返回值

    查询结果并非每次都需全部返回,可通过find的第二个参数指定需要的键。

    db.users.find({}, {_id:0, name:1, email:1})
    

    查询条件

    MongoDB 支持条件操作符,下表为 MongoDB 与 RDBMS 的条件操作符的对比,读者可以通过对比来理解 MongoDB 中条件操作符的使用方法。

    操作符 格式 实例 与 RDBMS where 语句比较
    等于(=) {<key> : {<value>}} db.test.find( {price : 24} ) where price = 24
    大于(>) {<key> : {$gt : <value>}} db.test.find( {price : {$gt : 24}} ) where price > 24
    小于(<) {<key> : {$lt : <value>}} db.test.find( {price : {$lt : 24}} ) where price < 24
    大于等于(>=) {<key> : {$gte : <value>}} db.test.find( {price : {$gte : 24}} ) where price >= 24
    小于等于(<=) {<key> : {$lte : <value>}} db.test.find( {price : {$lte : 24}} ) where price <= 24
    不等于(!=) {<key> : {$ne : <value>}} db.test.find( {price : {$ne : 24}} ) where price != 24
    与(and) {key01 : value01, key02 : value02, ...} db.test.find( {name : "《python编程》", price : 124} ) where name = "《python编程》" and price = 124
    或(or) {$or : [{key01 : value01}, {key02 : value02}, ...]} db.test.find( {$or:[{name : "《MongoDB 入门教程》"},{price : 24}]} ) where name = "《MongoDB 入门教程》" or price = 24
    或(in) {key01:{$in: [value01, value02, ...]} db.test.find(name:{$in:['alice','ben','carl']}) where name = "《MongoDB 入门教程》" or price = 24

    $in 相反的是 $nin,返回与数组中条件不匹配的文档。
    $in 能对单个键做或查询,要实现多条件的或查询应使用 $or$or 接受一个包含所有可能条件的数组作为参数。

    • 非查询
      $not是元条件句,可用在任何其他条件之上。

    • 多个条件查询

    # 可对一个键应用多个条件
    db.users.find({age:{$gt:18, $lt:30}})
    

    以下内容纯copy。

    正则

    正则能灵活有效地匹配字符串

    # 查询忽略大小写名为joe的文档
    db.users.find({name:/joe/i})
    
    # 查询匹配大小写组合形式的joe
    db.users.find({name:/joe?/i})
    
    

    MongoDB使用Perl兼容的正则(PCRE)库来匹配正则,PCRE支持的正则语法都能被MongoDB所接受。建议在查询中使用正则前,先在JS Shell中检查一下语法,确保匹配与设想的一致。

    MongoDB可为前缀型正则查询创建索引,所以此类查询非常高效。

    db.users.find({name:/^joey/})
    
    

    查询数组

    每个元素都是整个键的值

    db.users.insert({tags:['ios', 'wins', 'linux']})
    
    db.users.find({tags:'linux'})
    
    

    $all通过多个元素来匹配数组

    # 查询即有ios又有linux的文档
    db.users.find({tags:{$all:['wins', 'ios']}})
    
    # 查询数组指定位置的元素可使用 key.index 指定下标,数组下标以0开始。
    db.users.find({'tags.1': 'wins'})
    
    # 查询指定长度的数组,$size不能与其他子句组合。
    db.users.find({tags:{$size:3}})
    
    #当查询需一个长度范围时可通过在文档中添加一个size键的方式来实现,不幸的是这种技巧并不能与 $addToSet同时使用。
    db.users.update({$push:{remark:''}, $inc:{size:1}})
    db.users.find({size:{$gt:3}})
    
    

    $slice 操作符返回文档中指定数组的内部值

    # 查询博客某文章前10条评论
    db.blogs.findOne(criteria, {comments:{$slice:10}})
    
    # 查询博客某文章后10条评论
    db.blogs.findOne(criteria, {comments:{$slice:-10}})
    
    # 查询中junchow书架中第2到第4本书
    db.users.find({name:'junchow'}, {books:{$slice:[1,3]}, _id:0})
    
    # 查询出最后一本书
    db.users.find({name:'junchow'}, {books:{$slice:-1}, _id:0})
    
    

    查询内嵌文档

    db.users.insert({name:'tom', fullname:{first:'joe', last:'schmoe'}})
    
    # 使用点标识符查询内嵌的键,查询文档可包含点来表达深入内嵌文档内部的意思。
    db.users.find({'fullname.first':'joe'})
    
    

    为jim添加简历文档 jim.json

    db.users.insert({name:'jim'});
    var scores = [
      {subject:'php', score:'A'},
      {subject:'database', score:'B'},
      {subject:'javascript', score:'A+'}
    ];
    db.users.update({name:'jim'}, {$set:{scores:scores}});
    
    # 查询出考过php的用户
    db.users.find({'scores.subject':'php'},{_id:0});
    
    

    查询博客文章中由junchow发表的5分以上的评论

    # elemMatch 将限定条件进行分组,仅当需对内嵌文档的多个键操作时才会用到
    db.blogs.find({comments:{$elemMatch:{author:'junchow', score:{$gte:5}}}})
    
    

    $where查询

    键值对是很有表现力的查询方式,但依然有些需求是它无法满足的,此时就需要$where子句了。
    一定要避免使用$where查询,因为在速度上要比常规查询慢,由于每个文档都要从BSON转换成JSON,然后通过$where表达式来运行,同样不能利用索引。所以只能在走投无路时才考虑使用 $where

    分页

    limit() 返回指定的数据条数,limit指定的是上限而非下限。

    # 查询出前5条数据
    db.users.find({}, {_id:0, name:1}).limit(5)
    
    

    skip() 返回指定数据的跨度或偏移量

    由于skip存在性能上的问题,为解决此问题可在集合中加入date字段,在每次查询时将上次最后一个文档的日期记录下来,下次查询时可使用date为条件。

    db.users.find({date:{$gt:日期数据}}).limit(5)
    
    

    建议是将软件的重点放在便捷和精确查询上,而不是分页的性能上。

    # 查询第5到10条的文档
    db.users.find({}, {_id:0, name:1}).limit(5).skip(5)
    
    

    排序

    sort 返回按条件字段排序的数据,1表示升序,-1表示降序。

    db.users.find({}, {_id:0, name:1, age:1}).limit(5).skip(5).sort({age:1})
    
    db.users.find({}, {_id:0, name:1, age:1}).limit(5).skip(5).sort({age:-1})
    
    

    MongoDB中key可存不同类型的数据,因此排序有存在优先级的问题。

    随机

    从集中中随机挑选文档,最笨也是最慢的方式是先计算文档总数,然后选择一个从0到总数之间的随机数,再利用find()查询。

    var count = db.users.count();
    var random = Math.floor(Math.random()*count);
    db.users.find().skip(random).limit(1);
    
    

    解决方案是从在插入文档时给每个文档添加额外的随机键。

    db.users.insert({name:'john', random:Math.random()})
    
    

    查询随机文档时仅需计算随机数并将其作为查询条件即可

    db.users.findOne({random:{$gt:Math.random()}})
    
    

    游标

    数据库使用游标返回find查询结果,客户端对游标的实现通常能对最终结果进行有效的控制。可限制结果的数量,略过部分结果,根据任意方向任意键的组合对结果进行各种排序,或是执行其他一些功能强大的操作。

    要想从shell中创建一个游标,首先要对集合填充文档然后对其查询,并将结果分配给一个局部变量。

    for(i=0; i<1000; i++){
      db.test.insert({x:i})
    }
    var cursor = db.test.find()
    
    

    游标的好处是一次可查看一条结果,若将结果全部放在全局变量中,MongoDB shell会自动迭代,自动显示最开始的若干文档。

    要迭代结果可使用游标的next(),也可使用hasNext()来查看是否有结果。

    while(cursor.hasNext()){
      obj = cursor.next();
      //do stuff
    }
    
    

    游标类实现了迭代器接口,所以可在 foreach 循环中使用。

    var cursor = db.test.find();
    cursor.forEach(function(item){
      print(item.name);
    });
    
    

    当调用find()时,shell并不立即查询数据库,而是等待真正开始要求获取结果的时候才发送查询,这样在执行之前给查询额外的选项。几乎所有游标对象的方法都返回游标本身,这样可按任意顺序组成方法链。

    image

    游标的销毁条件

    • 客户端发来信息让其销毁
    • 游标迭代完毕
    • 默认游标超过10分钟自动清除

    查询快照
    快照后会针对不变的集合进行游标运动

    db.users.find({$query:{name:'jim'}, $snapshot:true})
    
    

    去重

    MongoDB的destinct命令是获取特定字段中不同值列表。该命令适用于普通字段,数组字段和数组内嵌文档.

    db.users.distinct('last_name')
    

    等同于 SQL 语句:

    select DISTINCT last_name from users
    

    distinct后面也可以添加查询条件, 如下:

    db.getCollection('new_media_api_log').distinct("userId",{"mediaSource" : "toutiao"}).length
    

    高级查询

    查询分为包装的和普通的两类。

    # 普通查询
    db.users.find({name:'junchow'})
    
    # 包装查询
    db.users.find({age:18}).sort(age:1)
    # 包装查询的本质
    db.users.find($query:{age:18}, $orderby:{age:1})
    
    

    包装查询选项

    • $maxscan:integer 指定查询最多扫描的文档数量
    • $min:document 查询的开始条件
    • $max:document 查询的结束条件
    • $hint:document 指定服务器使用哪个索引进行查询
    • $explain:boolean 获取查询执行细节
    • $snapshot:boolean 确保查询结果是在执行那一刻的一致快照

    相关文章

      网友评论

          本文标题:MongoDB查询

          本文链接:https://www.haomeiwen.com/subject/rmeccktx.html