mongoDB 是一个典型的NoSQL。文档形数据库(schema free),基于二进制JSON存储文档。
其高性能,高可用,直接加机器就可以解决扩展性的问题。和MySQL 一样,支持普通的CRUD,也支持复杂的聚合统计,全文检索,坐标检索(地理坐标检索)等功能。
1、基本用法
schema free 特性
无需提前定义字段,放什么就存什么。以Json格式存储。
{
"_id" : ObjectId("5d91663bcf4e197a81a590"),
"title" : "MongoDB",
"description" : "MongoDB 是一个 Nosql 数据库",
"by" : "简书",
"url" : "http://www.runoob.com",
"tags" : [
"mongodb",
"database",
"NoSQL"
]
}
对比MySQL
MySQL | MongoDB |
---|---|
database | database |
table | collection |
row | document(bson) |
column | field |
index | index |
table joins | $lookup |
primary key | _id |
group by | aggregation pipeline |
基本语句
基本用法可参考菜鸟教程 https://www.runoob.com/mongodb/mongodb-create-collection.html
这里专门提一下创建索引
语法中 Key 值为你要创建的索引字段,1 为指定按升序创建索引,如果你想按降序来创建索引指定为 -1 即可。
db.col.createIndex({"title":1})
createIndex() 方法中你也可以设置使用多个字段创建索引(关系型数据库中称作复合索引)。
db.col.createIndex({"title":1,"description":-1})
聚合操作
MySQL | MongoDB |
---|---|
where | $match |
group by | $group |
having | $match |
select | $project |
order by | $sort |
limit | $limt |
sum | $sum |
count | $sum |
聚合的具体用法
>db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION)
集合中的数据
{
_id: ObjectId(7df78ad8902c)
title: 'MongoDB Overview',
description: 'MongoDB is no sql database',
by_user: 'runoob.com',
url: 'http://www.runoob.com',
tags: ['mongodb', 'database', 'NoSQL'],
likes: 100
},
{
_id: ObjectId(7df78ad8902d)
title: 'NoSQL Overview',
description: 'No sql database is very fast',
by_user: 'runoob.com',
url: 'http://www.runoob.com',
tags: ['mongodb', 'database', 'NoSQL'],
likes: 10
},
{
_id: ObjectId(7df78ad8902e)
title: 'Neo4j Overview',
description: 'Neo4j is no sql database',
by_user: 'Neo4j',
url: 'http://www.neo4j.com',
tags: ['neo4j', 'database', 'NoSQL'],
likes: 750
},
mongo 的查询 pipeline 流式操作
> db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : 1}}}])
{
"result" : [
{
"_id" : "runoob.com",
"num_tutorial" : 2
},
{
"_id" : "Neo4j",
"num_tutorial" : 1
}
],
"ok" : 1
}
>
其查询结果类似于mysql中的
select by_user, count(*) from mycol group by by_user
2、整体存储架构
- Mongod : 单机版数据库
- Replica Set:复制集,由多个Mongod组成的高可用存储单元。
- Sharding : 分布式集群,由多个Replica Set 组成的可扩展集群。
Mongod架构
- 默认采用的WiredTiger 高性能存储引擎
- 基于journaling log 宕机恢复(类比mysql的redo log)
- 至少3个节点组成。其中一个可以只充当arbiter
- 主从基于oplog复制同步(类比mysql binlog)
- 客户端默认读写的都是 primary 节点
分布式集群架构
sharding 架构- mongos 做请求路由代理,路由请求到特定的shard
- config servers 存储源数据(也是一个replica set)
- 每一个shard是一个replica set,可以无限扩容
collection 分片
collection 被分片存储collection 分片
- collection 自动分裂成为多个chunk
- 每个chunk被自动负载均衡到不通的shard
- 每个shard可以保证其上的chunk高可用
按range 拆分chunk
按range 拆分chunk- shard key 可以是单索引字段或者是联合索引字段。
- 超过16MB的chunk 被一分为二。
shard的激活配置等
参考菜鸟教程
https://www.runoob.com/mongodb/mongodb-sharding.html
网友评论