mongoDB读书笔记

作者: ofelia_why | 来源:发表于2016-10-22 10:16 被阅读106次

MongoDB

这几天编写程序,发现如果没有理论的支持,即使时间花的再多,效率也是不高的,所以每天在编程之前都应该先给自己充一下电。这次重新看了mongoDB权威开发指南的前四章,做了下面的读书笔记。

  • mongoDB 是面向文档的数据库,不是关系型数据库;
  • 文档是MongoDb中数据的基本单元;
  • 每一个文档都有一个特殊的键"_id",在文档所处的集合中是唯一的。可以作为文档的唯一标识符

文档

文档是MongoDB的核心概念。包括多个键和关联的值,有序地存放在一起;

{"greeting": "Hello world!"};
  • 键: greeting;
  • 值: hello world;

多个键值对:

{
    "greeting": "hello world",  //字符串
    "foo": "2"  //整形
}

//另外的一个键值对
{
    "foo": "2",
    "greeting": "hello world"
}

文档中的键/值对必须是有序的,上面两个是不同的键值对

字符串作为键的要求:

  1. 键不能含有\0空字符,这个字符用来保存键的结尾
  2. .$有特别的含义,也不可以
  3. _开头的键是保留的
  4. MongoDB 区分类型,也区分大小写,不能有重复的键

集合是多个键值对的集合


mongoDB的使用

  • mongoDB在没有参数的情况下会默认数据目录为/data/db
  • 默认情况下,mongoDB监听27017端口
  • mongod还会启动一个基本的http服务器,监听28017端口
  • 可以通过浏览器访问http://localhost:28017来获取数据库的管理信息
  • shell下可以输入ctrl+C来停止Mongd的运行

MongoDB中存储的文档必须有一个_id值。

  • 这个值可以是任意类型的,默认是ObjectId对象。
  • 在一个集合里面,每一个文档都有一个唯一的_id值,来确保集合里面的每一个文档都能被唯一标识
  • ObjectID_id的默认类型
  • 在插入文档的时候没有_id,系统会自动帮你创建一个。

强大的shell操作

  • insert添加一个文档到集合里面
db.数据库名.insert(自己定义好的一条数据)
  • find查找数据库,返回集合里面的所有文档
db.数据库名.find()
  • findOne(),返回数据库里面的一个文档
db.数据库名.findOne()
  • update()更改数据库,接受至少两个参数,一个是更新的文档限定条件,一个是新的文档
db.blog.update({title:"my blog"}, post)
  • remove()删除,没有参数会删除所有的文档,一般接受一个条件
db.blog.remove({title:"my blog"})
  • 移除blog中所有opt-out为true的人
db.blog.remove({"opt-out": true});
  • 删除数据是永久性的,不能撤销也不能恢复

更改器的使用

  • $inc 修改器增加pageviews的值
//将name为1对应的文档中的pageview增加1
db.analytics.update({"name":"1"}, {"$inc": {"pageview": 1}});

注意:使用修改器不能修改_id的值。

  • $set修改器用来指定一个键的值,如果这个键不存在,那么就创建它;
//users表中username为why的文档中的favoriteBook设置为c
db.users.update({"username": "why"}, {"$set": {"favoriteBook": "c"}});
  • $set甚至可以修改键的数据类型, $set还可以修改内嵌的属性
//将favoirteBook的键值设置为一个数组
db.users.update({"username": "why"},{"$set": {"favoriteBook": ["c","c++"]}});
  • $unset可以完全删除字段
db.users.update({"username": "why"},{"$unset": {"favoriteBook": "c"}});
  • $inc可以累计一个属性,如果不存在,那么会事先创建一个新的属性
//可以自己给它创建一个score: 50的属性
{"$inc": {"score": 50}}
//score+1
{"$inc": {"score": 1}}
//结果将变为score: 51;

$inc只能用来修改数字,如果想要改变其他类型的值,可以选择用$set


数组的操作

  • $push给已有的数组末尾添加一个元素,
  • 要是没有这个数组,会自动创建一个新的数组
  • 继续添加元素,只需要再次使用$push
  • 如果一个值不再数组里面,那么先用$ne来创建一个新的字段,再把它push到这个数组里面
db.user.update({"username": "{"$ne": "WHY"}"}, {$push:{"username": "WHY"}})
  • 如果$ne行不通,可以直接使用$addToSet,这样还可以避免重复
db.users.update({"username":"why"}, 
   {"$addToSet": {"emails":"qq.mail"}}
);

db.users.update({"username":"why"},
   {"$addToSet": {"emails":{"qq.mail","126.com"}} }
);
  • 将数组作为队列或者是栈,可以使用$pop这个修改器

  • 从数组的任何一端删除元素

  • {$pop: {key: 1}} 从数组末尾删除一个元素

  • {$pop: {key: -1}} 从数组头部删除

  • $pull 会将数组中匹配的部分删除掉

db.lists.insert({"todo": {"dishes": "dishes" ,"laundry","dry cleaning"}})

db.lists.update({}, {"$pull", "{"todo":"laundry"}");

db.list.find()
{
    "_id": ObjectId("XXXX"),
    "todo" : {
      "dishes",
      "dry cleaning"
    }
}

对于数组[1,1,2,1]执行pull 1 ,那么他会删掉重复的字段

  • 定位符$
//将原先author为tom的字段修改为why
db.blog.update({"comments.author": "tom"},
               {"$set": {"comments.$.author": "why"}});
  • $定位符之id那个匹配第一个匹配的元素。所以如果有多个评论人为tom的字段,只会修改第一个匹配的字段

  • $upsert

db.math.remove()
db.math.upsert({"count": 25}, {"$inc": {"count": 3}}, true);
db.math.findOne() {
    "id": ObjetcId(XXX);
    "count": 28
}

先清空了集合,然后里面就没有文档,
再用upsert创建一个count的值为25的文档
然后将这个值加3,最后得到count为28的文档。
如果没有开启upsert的选项,{"count" : 25}不会匹配到任何的文档,就不会有修改
再次运行,由于没有{"count": 25}的选项,那么他会再次创建一个count为25的字段,
然后再次+3为28

  • $save是保存
db.users.save();

更新多个文档

  • 默认情况下,更新只能对符合匹配条件的第一个文档执行操作。
  • 要是有多个文档符合条件,其余的文档就没有变化。
  • 要使得匹配到的文档都得到更新,那么可以设置update的第四个参数为true
db.users.update({"birthday": "10/13/2016"},
{$set: {gift: {"happy birthday"}}, false, true});

如果想知道文档到底更新了多少,可以运行getLastError命令

db.runCommand({getLastError: 1});

{
    "err": null,
    "updateExisting": true,
    "n": 5,
    "ok": true
}
  • 这里的n=5就说明有5个文档被更新了。
  • updateExisting: true说明是对已有的文档进行更新

getLastError只能获取更新的信息,不能返回已经更新的文档,

我们可以通过findAndModify获取更新好的文档,缺点是有点慢,需要等待数据库的响应

db.runCommand({
    "findAndModify": "processes",
    "query": {},
    "sort": {},
    "update": {}
})
  • findAndModify: 字符串,集合的名字
  • query: 查询文档,用来查询文档的条件
  • sort: 排序的条件
  • update: 修改器文档,对所有找到的文档执行更新
  • remove:布尔类型,表示是否删除文档
  • new: 布尔类型,表示返回的是更新前的文档还是更新后的文档,默认是更新前的文档。
  • update和remove必须有一个,也只能有一个,如果匹配不到文档,那么则这个命令会返回一个错误
  • 一次只能处理一个文档,也不能执行upsert操作,只能更新已有的文档
  • 对于普通的更新来说,findAndModify速度比较慢,时间相当一次查找,一次更新和一次getLastError

查询

  • find查询,查询返回一个集合中文档的子集,
    1. 子集的范围是从0个文档到整个集合
    2. find的第一个参数决定要返回哪些文档,其形式也是一个文档,说明要查询的细节
    3. 空的查询文档, 会返回集合的全部内容,如果不指定查询文档。默认就是空。
/这样会返回集合c中的全部内容
db.users.find{}
  • 当向查询文档中添加键值对时,就以限定了查找的条件
    查找方式是:1. 整数匹配整数,2. 布尔值匹配布尔值, 3. 字符串匹配字符串。
//查询所有年龄为27岁的用户
db.users.find({"age": 27});
//查询username为joe的字段
db.users.find({"username": "joe"});
//这样是多字段查询,会返回username为joe,年龄为27的所以字段
db.users.find({"username": "joe", "age":27})

指定返回的键

  • 有时不需要将文档中的所有键值对全部返回
  • 可以通过find()或者findOne()的第二个参数来指定想要的键
  • 这样可以节省传输的数据量,也可以节省客户端解码文档的时间和内存消耗
db.users.find({}, {"username": 1, "email": 1})
  • 返回找到字段中的usernameemail
  • 还有一个是_id,这个键总是被返回,即使没有指定_id显示也是一样
  • 也可以通过第二个参数来剔除查询结果中的某个键值对
db.users.find({}, {"password": 0});`

这样返回的字段中就不会出现password这个键值对

查询条件

  • $lt,$lte,$gt,$gte,是全部的比较操作符,分别对应<, <=,>, >=
  • 可以将它们组合起来查询一个范围的值
//查询年龄是18-30岁(含)的所有用户
db.users.find({"age": {"$gte": 18, "$lte": 30}})
//可以查询在现在这个时间之前注册过的用户
start = new Date();
db.users.find({"registerDate": {"$lt": start}})
  • $ne表示不等
//找到名字不是joe的用户
db.users.find({"username": {"$ne":"joe"}})

$ne可以用于所有类型的数据

OR查询

mongoDB有两种方式进行OR查询,$in可以查询一个键的多个值,
$or可以用来完成多个键值对的任意给定值(更加通用)

db.users.find({"username": {"$in":["why","joe"]}})

这回匹配usernamewhy的文档,也会匹配usernamejoe的文档

如果$in中对于的数组只有一个值,那么这和直接匹配这个值得效果是一样的

{ticket_no: {$in:[125]}}和{ticket_no: 125}是一样的

与$in相反的是$nin,将返回与数组中所有条件都不匹配的文档

db.users.find({"username": {"$nin":["why","joe"]}})

返回username既不是why,也不是joe的user

$in只能对单个键做OR查询,而$or可以查询包含所有可能条件的参数作为数组

db.raffie.find({"$or": [{"ticket_no": 125}, {"winner": true}]})

这样会返回ticket_no"是125,winner是true的所有字段

$or还可以含有其他条件语句

db.raffie.find({"$or": [
   {"ticket_no": ["$in":[123,124,125]]},
   {"winner": true}
]})

条件句的规则

在查询中,$lt在内层文档,而更新中$inc是外层文档的键
条件句是内层文档的键,而修改器是外层文档的键
一个键可以有多个条件,但是一个键不能对于多个更新更改器

//正确
db.users.find({"age": {"lt": 30, "$gt": 20})
//错误
db.user.find({"$inc": {"age":1}, "$set": {age:40}})

null比较特殊,不仅仅匹配自身,而且还匹配不存在,所以我们在匹配键值为null的文档的同时,还要检查该建筑是否存在

db.c.find({"z": {"$in":[null], "$exists": true}});

没有$eq操作符,我们使用$in操作符代替

正则表达式

匹配名为Joe或者joe的用户,可以用正则表达式匹配大小写

db.users.find({"name":/joe/i})

正则表达式还可以插入到数据库,自身也可以匹配

db.foo.insert({"bar": /baba/})
db.foo.find("bar": /baba/)
{
    "_id": ObjectId("XXXXX"),
    "bar": /baba/
}

查询数组

  • 插入一个数组
db.food.insert({"fruit":["apple", "banana"]})
db.food.find({"fruit":"banana"})
//找得到,但是比较低效
  • $all 如果需要多个元素来匹配数组,那么就需要用到$all,这样会匹配一组元素
db.find({"fruit": {$all: ["apple"]})
  • $size 可以用来查询指定长度的数组
db.food.({"fruit": {"$size":3}})
  • $slice find的第二个参数是可选的,可以返回那些键,"$slice"返回的是数组的一个子集合
//返回的是前10条评论
db.blog.posts.findOne(criteria, {"comments": {"$slice": 10}})

//-10表示的是后10条评论
db.blog.posts.findOne(criteria, {"comments": {"$slice": -10}})

//这个操作会跳过前面的前23个元素,返回第24个到第33个元素。
//如果数组不够33个元素,那么会返回第23个元素后面的全部元素
db.blog.posts.findOne(criteria, {"comments": {"$slice": [23,10]}})
  • limit()限制查询的结果数量
//只返回3个结果
如果返回的结果不足3个,那么返回匹配数量的结果。limit是上限而不是下线
db.c.find().limit(3);

//skip与limit类似
db.c.find().skip(3)
  • sort是用一个对象作为参数:
    一组键值对,键对应文档的键名,值代表查询的方向,排序方向可以是1升序-1降序 。 如果指定了多个键,那么按照键的顺序逐个进行进行排序
db.c.find().sort({username: 1, age: -1})

简单的分页, 按照date的降序显示文档

var page1 = db.foo.find(cirterial).limit(100)
var latest = null;
while(page1.hasNext()) {
    latest = page1.next();
    display(latest);
}
//get next page
var page2 = db.foo.find({"date": {"$gt": latest.date}});
page2.sort({"date": -1}).limit(100);

唯一索引

db.people.ensureIndex({"username": 1}, {"unique": true});

相关文章

网友评论

    本文标题:mongoDB读书笔记

    本文链接:https://www.haomeiwen.com/subject/htthuttx.html