mongoDB基础
MongoDB简介
一个开源文档数据库,提供高性能、高可用性和自动扩展的功能。MongoDB 是用C++语言编写的非关系型数据库。使用高效的二进制数据存储,文件存储格式为BSON (一种JSON 的扩展)等。MongoDB 支持各种编程语言,包括Python、Java、C++、GO、PHP等。
MongoDB特性
- 面向集合存储。数据被分组到若干集合,每个集合可以包含无限个文档,可以将集合想象成RDBMS的表,区别是集合不需要进行模式定义。
- 模式自由。集合中没有行和列的概念,每个文档可以有不同的key,key的值不要求一致的数据类型。
- 支持动态查询。mongoDB支持丰富的查询表达式,查询指令使用json形式表达式。
- 完整的索引支持。mongoDB的查询优化器会分析查询表达式,并生成一个高效的查询计划。
- 高效的数据存储,支持二进制数据及大型对象(图片、视频等)。
- 支持复制和故障恢复。
- 自动分片以支持云级别的伸缩性,支持水平的数据库集群,可动态添加额外的服务器
CURD增删改查,这是数据库最基本的功能,查询还支持全文检索,GEO地理位置查询等。
- db.collection.insertOne() 单个文档插入到集合中
- db.collection.insertMany() 多个文档插入到集合中
- db.collection.insert() 单个或者多个文件插入到集合中
- db.collection.find( ) 查询数据
- db.collection.updateOne() 更新单条
- db.collection.updateMany() 更新多条
- db.collection.deleteOne() 删除单条文档
- db.collection.deleteMany() 删除多条文档
Aggregation类似MySQL中的count、sum、group by
aggregation实例
db.orders.aggregate([
{$match:{status:"A"}},
{$group:{_id:"$cost_id", total:{$sum:"$amount"}}}
])
聚合内置了很多函数,使用好了这些函数我们就可以统计出我们想要的数据。
- $project:修改输入文档的结构。可以用来重命名、增加或删除域,也可以用于创建计算结果以及嵌套文档。
- match使用MongoDB的标准查询操作。
- $limit:用来限制MongoDB聚合管道返回的文档数。
- $skip:在聚合管道中跳过指定数量的文档,并返回余下的文档。
- $group:将集合中的文档分组,可用于统计结果。
- $sort:将输入文档排序后输出。
- $geoNear:输出接近某一地理位置的有序文档。
- $unwind:将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值。
实例一
db.getCollection('A_collection').aggregate({
$addFields:{
"name":{
$cond:[{$ne:["$alias", undefined]},"$alias","$host_name"]
}
},
{
$project:{
"name":1
}
}
}) //collection的alias字段是否存在,如果存在,就取alias,否则取host_name字段
实例二
{ "_id" : 1, "item" : "abc1", qty: 300 }
{ "_id" : 2, "item" : "abc2", qty: 200 }
{ "_id" : 3, "item" : "xyz1", qty: 250 }
//根据qty的值来生成新的数据(值)
db.inventory.aggregate([
{$project:
{ item: 1,
discount: {$cond: { if: { $gte: [ "$qty", 250 ] }, then: 30, else: 20 }}
}
}])
//output discount是新的键,它根据cond的if判断后,分别被赋上了相应的值
{ "_id" : 1, "item" : "abc1", "discount" : 30 }
{ "_id" : 2, "item" : "abc2", "discount" : 20 }
{ "_id" : 3, "item" : "xyz1", "discount" : 30 }
BSON
MongoDB中的JSON文档存储在名为BSON(二进制编码的JSON)的二进制表示中。
与其他将JSON数据存储为简单字符串和数字的数据库不同,BSON编码扩展了JSON表示,
使其包含额外的类型,如int、long、date、浮点数和decimal128。这使得应用程序更容易可靠地处理、排序和比较数据。
连接MongoDB的Go驱动程序中有两大类型表示BSON数据:D和Raw。
类型D家族被用来简洁地构建使用本地Go类型的BSON对象。这对于构造传递给MongoDB的命令特别有用。D家族包括四类:
- D:一个BSON文档。这种类型应该在顺序重要的情况下使用,比如MongoDB命令。
- M:一张无序的map。它和D是一样的,只是它不保持顺序。
- A:一个BSON数组。
- E:D里面的一个元素。
GridFS
- GridFS是MongoDB的一个子模块,主要用于在MongoDB中存储文件,相当于MongoDB内置的一个分布式文件系统。
- 本质上还是讲文件的数据分块存储在集合中,默认的文件集合分为fs.files和fs.chunks。
- fs.files是存储文件的基本信息,比如文件名,大小,上传时间,md5等。
- fs.chunks是存储文件真正数据的地方,一个文件会被分割成多个chunk块进行存储,一般为256k/个。
如果你的项目中用到了MongoDB,那么你可以使用GridFS来构建一个文件系统,这样就不用去购买第三方的存储服务了。
GridFS的好处是你不用单独去搭建一个文件系统,直接使用Mongodb自带的即可,备份,分片都依赖MongoDB,维护起来也方便。
网友评论