美文网首页DB优化Hadoop
了解一下mongodb?

了解一下mongodb?

作者: OOM_Killer | 来源:发表于2019-07-21 18:36 被阅读70次

    mongoDB 是一个典型的NoSQL。文档形数据库(schema free),基于二进制JSON存储文档。
    其高性能,高可用,直接加机器就可以解决扩展性的问题。和MySQL 一样,支持普通的CRUD,也支持复杂的聚合统计,全文检索,坐标检索(地理坐标检索)等功能。

    Mongodb.png

    1、基本用法

    schema free 特性

    无需提前定义字段,放什么就存什么。以Json格式存储。

    {
            "_id" : ObjectId("5d91663bcf4e197a81a590"),
            "title" : "MongoDB",
            "description" : "MongoDB 是一个 Nosql 数据库",
            "by" : "简书",
            "url" : "http://www.runoob.com",
            "tags" : [
                    "mongodb",
                    "database",
                    "NoSQL"
            ]
    }
    
    对比MySQL
    MySQL MongoDB
    database database
    table collection
    row document(bson)
    column field
    index index
    table joins $lookup
    primary key _id
    group by aggregation pipeline
    基本语句

    基本用法可参考菜鸟教程 https://www.runoob.com/mongodb/mongodb-create-collection.html
    这里专门提一下创建索引
    语法中 Key 值为你要创建的索引字段,1 为指定按升序创建索引,如果你想按降序来创建索引指定为 -1 即可。

    db.col.createIndex({"title":1})
    

    createIndex() 方法中你也可以设置使用多个字段创建索引(关系型数据库中称作复合索引)。

    db.col.createIndex({"title":1,"description":-1})
    
    聚合操作
    MySQL MongoDB
    where $match
    group by $group
    having $match
    select $project
    order by $sort
    limit $limt
    sum $sum
    count $sum

    聚合的具体用法

    >db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION)
    

    集合中的数据

    {
       _id: ObjectId(7df78ad8902c)
       title: 'MongoDB Overview', 
       description: 'MongoDB is no sql database',
       by_user: 'runoob.com',
       url: 'http://www.runoob.com',
       tags: ['mongodb', 'database', 'NoSQL'],
       likes: 100
    },
    {
       _id: ObjectId(7df78ad8902d)
       title: 'NoSQL Overview', 
       description: 'No sql database is very fast',
       by_user: 'runoob.com',
       url: 'http://www.runoob.com',
       tags: ['mongodb', 'database', 'NoSQL'],
       likes: 10
    },
    {
       _id: ObjectId(7df78ad8902e)
       title: 'Neo4j Overview', 
       description: 'Neo4j is no sql database',
       by_user: 'Neo4j',
       url: 'http://www.neo4j.com',
       tags: ['neo4j', 'database', 'NoSQL'],
       likes: 750
    },
    

    mongo 的查询 pipeline 流式操作

    > db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : 1}}}])
    {
       "result" : [
          {
             "_id" : "runoob.com",
             "num_tutorial" : 2
          },
          {
             "_id" : "Neo4j",
             "num_tutorial" : 1
          }
       ],
       "ok" : 1
    }
    >
    

    其查询结果类似于mysql中的

    select by_user, count(*) from mycol group by by_user
    

    2、整体存储架构

    • Mongod : 单机版数据库
    • Replica Set:复制集,由多个Mongod组成的高可用存储单元。
    • Sharding : 分布式集群,由多个Replica Set 组成的可扩展集群。
    Mongod架构
    • 默认采用的WiredTiger 高性能存储引擎
    • 基于journaling log 宕机恢复(类比mysql的redo log)
    Replica Set 架构
    • 至少3个节点组成。其中一个可以只充当arbiter
    • 主从基于oplog复制同步(类比mysql binlog)
    • 客户端默认读写的都是 primary 节点
    分布式集群架构
    sharding 架构
    • mongos 做请求路由代理,路由请求到特定的shard
    • config servers 存储源数据(也是一个replica set)
    • 每一个shard是一个replica set,可以无限扩容

    collection 分片

    collection 被分片存储
    collection 分片
    • collection 自动分裂成为多个chunk
    • 每个chunk被自动负载均衡到不通的shard
    • 每个shard可以保证其上的chunk高可用
    按range 拆分chunk
    按range 拆分chunk
    • shard key 可以是单索引字段或者是联合索引字段。
    • 超过16MB的chunk 被一分为二。
    shard的激活配置等

    参考菜鸟教程
    https://www.runoob.com/mongodb/mongodb-sharding.html

    参考 https://docs.mongodb.com/manual/core/ranged-sharding/

    相关文章

      网友评论

        本文标题:了解一下mongodb?

        本文链接:https://www.haomeiwen.com/subject/efrvlctx.html