mongodb中aggregate()方法统计查询
db.getCollection('wx_content').aggregate([{uid", num_tutorial : {$sum : 1}}}])
类似于SQL中
select uid, count(*) from wx_content group by uid
一、前言
MongoDB作为NoSQL(NoSQL = Not Only SQL 意即"不仅仅是SQL"。),由 C++ 语言编写。旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。
传统的关系数据库(如mysql)一般由数据库(database)、表(table)、记录(record)三个层次概念组成,MongoDB是由数据库(database)、集合(collection)、文档对象(document)三个层次组成。
MongoDB提供了很丰富的查询条件,因其接入Javascrip风格语法,支持for,while,next,hasNext,forEach,toArray,findOne,limit等语句。
本文主要收集整理MongoDB的查询方式。
二、查询方式
MongoDB查询可以在启动服务后进入shell界面进行,也可以在客户端查询窗口进行。
常用命令
show dbs -- 查看数据库列表
use admin --创建admin数据库,如果存在admin数据库则使用admin数据库
db ---显示当前使用的数据库名称
db.getName() ---显示当前使用的数据库名称
db.dropDatabase() --删当前使用的数据库
db.repairDatabase() --修复当前数据库
db.version() --当前数据库版本
db.getMongo() --查看当前数据库的链接机器地址
db.stats() 显示当前数据库状态,包含数据库名称,集合个数,当前数据库大小 ...
db.getCollectionNames() --查看数据库中有那些个集合(表)
show collections --查看数据库中有那些个集合(表)
db.person.drop() --删除当前集合(表)person
三、基本查询
find查询
MongoDB 中查询文档使用 find() 方法。find() 方法以非结构化的方式来显示所要查询的文档, 查询数据的语法格式如下:
db.collection.find(query, projection)
query 为可选项,设置查询操作符指定查询条件;projection 也为可选项,表示使用投影操作符指定返回的字段,如果忽略此选项则返回所有字段。
# 查询users集合中所有内容
db.users.find()
向查询文档中添加键值对时,意味着限制查询条件。
db.users.find({name:'alice'});
db.users.find({age:20});
# 查询名为alice且年龄为20的用户
db.users.find({name:'alice', age:20});
返回值
查询结果并非每次都需全部返回,可通过find的第二个参数指定需要的键。
db.users.find({}, {_id:0, name:1, email:1})
查询条件
MongoDB 支持条件操作符,下表为 MongoDB 与 RDBMS 的条件操作符的对比,读者可以通过对比来理解 MongoDB 中条件操作符的使用方法。
操作符 | 格式 | 实例 | 与 RDBMS where 语句比较 |
---|---|---|---|
等于(=) | {<key> : {<value>}} | db.test.find( {price : 24} ) | where price = 24 |
大于(>) | {<key> : {$gt : <value>}} | db.test.find( {price : {$gt : 24}} ) | where price > 24 |
小于(<) | {<key> : {$lt : <value>}} | db.test.find( {price : {$lt : 24}} ) | where price < 24 |
大于等于(>=) | {<key> : {$gte : <value>}} | db.test.find( {price : {$gte : 24}} ) | where price >= 24 |
小于等于(<=) | {<key> : {$lte : <value>}} | db.test.find( {price : {$lte : 24}} ) | where price <= 24 |
不等于(!=) | {<key> : {$ne : <value>}} | db.test.find( {price : {$ne : 24}} ) | where price != 24 |
与(and) | {key01 : value01, key02 : value02, ...} | db.test.find( {name : "《python编程》", price : 124} ) | where name = "《python编程》" and price = 124 |
或(or) | {$or : [{key01 : value01}, {key02 : value02}, ...]} | db.test.find( {$or:[{name : "《MongoDB 入门教程》"},{price : 24}]} ) | where name = "《MongoDB 入门教程》" or price = 24 |
或(in) | {key01:{$in: [value01, value02, ...]} | db.test.find(name:{$in:['alice','ben','carl']}) | where name = "《MongoDB 入门教程》" or price = 24 |
与 $in
相反的是 $nin
,返回与数组中条件不匹配的文档。
$in
能对单个键做或查询,要实现多条件的或查询应使用 $or
。$or
接受一个包含所有可能条件的数组作为参数。
-
非查询
$not
是元条件句,可用在任何其他条件之上。 -
多个条件查询
# 可对一个键应用多个条件
db.users.find({age:{$gt:18, $lt:30}})
以下内容纯copy。
正则
正则能灵活有效地匹配字符串
# 查询忽略大小写名为joe的文档
db.users.find({name:/joe/i})
# 查询匹配大小写组合形式的joe
db.users.find({name:/joe?/i})
MongoDB使用Perl兼容的正则(PCRE)库来匹配正则,PCRE支持的正则语法都能被MongoDB所接受。建议在查询中使用正则前,先在JS Shell中检查一下语法,确保匹配与设想的一致。
MongoDB可为前缀型正则查询创建索引,所以此类查询非常高效。
db.users.find({name:/^joey/})
查询数组
每个元素都是整个键的值
db.users.insert({tags:['ios', 'wins', 'linux']})
db.users.find({tags:'linux'})
$all
通过多个元素来匹配数组
# 查询即有ios又有linux的文档
db.users.find({tags:{$all:['wins', 'ios']}})
# 查询数组指定位置的元素可使用 key.index 指定下标,数组下标以0开始。
db.users.find({'tags.1': 'wins'})
# 查询指定长度的数组,$size不能与其他子句组合。
db.users.find({tags:{$size:3}})
#当查询需一个长度范围时可通过在文档中添加一个size键的方式来实现,不幸的是这种技巧并不能与 $addToSet同时使用。
db.users.update({$push:{remark:''}, $inc:{size:1}})
db.users.find({size:{$gt:3}})
$slice
操作符返回文档中指定数组的内部值
# 查询博客某文章前10条评论
db.blogs.findOne(criteria, {comments:{$slice:10}})
# 查询博客某文章后10条评论
db.blogs.findOne(criteria, {comments:{$slice:-10}})
# 查询中junchow书架中第2到第4本书
db.users.find({name:'junchow'}, {books:{$slice:[1,3]}, _id:0})
# 查询出最后一本书
db.users.find({name:'junchow'}, {books:{$slice:-1}, _id:0})
查询内嵌文档
db.users.insert({name:'tom', fullname:{first:'joe', last:'schmoe'}})
# 使用点标识符查询内嵌的键,查询文档可包含点来表达深入内嵌文档内部的意思。
db.users.find({'fullname.first':'joe'})
为jim添加简历文档 jim.json
db.users.insert({name:'jim'});
var scores = [
{subject:'php', score:'A'},
{subject:'database', score:'B'},
{subject:'javascript', score:'A+'}
];
db.users.update({name:'jim'}, {$set:{scores:scores}});
# 查询出考过php的用户
db.users.find({'scores.subject':'php'},{_id:0});
查询博客文章中由junchow发表的5分以上的评论
# elemMatch 将限定条件进行分组,仅当需对内嵌文档的多个键操作时才会用到
db.blogs.find({comments:{$elemMatch:{author:'junchow', score:{$gte:5}}}})
$where查询
键值对是很有表现力的查询方式,但依然有些需求是它无法满足的,此时就需要$where
子句了。
一定要避免使用$where
查询,因为在速度上要比常规查询慢,由于每个文档都要从BSON转换成JSON,然后通过$where
表达式来运行,同样不能利用索引。所以只能在走投无路时才考虑使用 $where
。
分页
limit() 返回指定的数据条数,limit指定的是上限而非下限。
# 查询出前5条数据
db.users.find({}, {_id:0, name:1}).limit(5)
skip() 返回指定数据的跨度或偏移量
由于skip存在性能上的问题,为解决此问题可在集合中加入date字段,在每次查询时将上次最后一个文档的日期记录下来,下次查询时可使用date为条件。
db.users.find({date:{$gt:日期数据}}).limit(5)
建议是将软件的重点放在便捷和精确查询上,而不是分页的性能上。
# 查询第5到10条的文档
db.users.find({}, {_id:0, name:1}).limit(5).skip(5)
排序
sort 返回按条件字段排序的数据,1表示升序,-1表示降序。
db.users.find({}, {_id:0, name:1, age:1}).limit(5).skip(5).sort({age:1})
db.users.find({}, {_id:0, name:1, age:1}).limit(5).skip(5).sort({age:-1})
MongoDB中key可存不同类型的数据,因此排序有存在优先级的问题。
随机
从集中中随机挑选文档,最笨也是最慢的方式是先计算文档总数,然后选择一个从0到总数之间的随机数,再利用find()查询。
var count = db.users.count();
var random = Math.floor(Math.random()*count);
db.users.find().skip(random).limit(1);
解决方案是从在插入文档时给每个文档添加额外的随机键。
db.users.insert({name:'john', random:Math.random()})
查询随机文档时仅需计算随机数并将其作为查询条件即可
db.users.findOne({random:{$gt:Math.random()}})
游标
数据库使用游标返回find查询结果,客户端对游标的实现通常能对最终结果进行有效的控制。可限制结果的数量,略过部分结果,根据任意方向任意键的组合对结果进行各种排序,或是执行其他一些功能强大的操作。
要想从shell中创建一个游标,首先要对集合填充文档然后对其查询,并将结果分配给一个局部变量。
for(i=0; i<1000; i++){
db.test.insert({x:i})
}
var cursor = db.test.find()
游标的好处是一次可查看一条结果,若将结果全部放在全局变量中,MongoDB shell会自动迭代,自动显示最开始的若干文档。
要迭代结果可使用游标的next(),也可使用hasNext()来查看是否有结果。
while(cursor.hasNext()){
obj = cursor.next();
//do stuff
}
游标类实现了迭代器接口,所以可在 foreach 循环中使用。
var cursor = db.test.find();
cursor.forEach(function(item){
print(item.name);
});
当调用find()时,shell并不立即查询数据库,而是等待真正开始要求获取结果的时候才发送查询,这样在执行之前给查询额外的选项。几乎所有游标对象的方法都返回游标本身,这样可按任意顺序组成方法链。
image游标的销毁条件
- 客户端发来信息让其销毁
- 游标迭代完毕
- 默认游标超过10分钟自动清除
查询快照
快照后会针对不变的集合进行游标运动
db.users.find({$query:{name:'jim'}, $snapshot:true})
去重
MongoDB的destinct命令是获取特定字段中不同值列表。该命令适用于普通字段,数组字段和数组内嵌文档.
db.users.distinct('last_name')
等同于 SQL 语句:
select DISTINCT last_name from users
distinct后面也可以添加查询条件, 如下:
db.getCollection('new_media_api_log').distinct("userId",{"mediaSource" : "toutiao"}).length
高级查询
查询分为包装的和普通的两类。
# 普通查询
db.users.find({name:'junchow'})
# 包装查询
db.users.find({age:18}).sort(age:1)
# 包装查询的本质
db.users.find($query:{age:18}, $orderby:{age:1})
包装查询选项
- $maxscan:integer 指定查询最多扫描的文档数量
- $min:document 查询的开始条件
- $max:document 查询的结束条件
- $hint:document 指定服务器使用哪个索引进行查询
- $explain:boolean 获取查询执行细节
- $snapshot:boolean 确保查询结果是在执行那一刻的一致快照
网友评论