美文网首页
Mycat基础入门

Mycat基础入门

作者: AC编程 | 来源:发表于2020-09-11 16:25 被阅读0次

    一、Mycat简介

    1.1 什么是Mycat

    Mycat是目前最流行的基于Java语言编写的数据库中间件,是一个实现了MySQL协议的服务器,前端用户可以把它看作是一个数据库代理,用MySQL客户端工具和命令行访问,而后端可以用MySQL原生协议与多个MySQL服务器通信,也可以用JDBC协议与大多数主流数据库服务器通信,其核心功能是分库分表。配合数据库的主从模式还可以实现读写分离。

    Mycat是基于阿里开源的Cobar产品而研发,Cobar的稳定性、可靠性、优秀的架构和性能以及众多成熟的使用案例使得MyCat变得非常的强大。

    Mycat发展到目前的版本,已经不是一个单纯的MySQL代理了,它的后端可以支持MySQL、SQL Server、Oracle、DB2、PostgreSQL等主流数据库,也支持MongoDB这种新型NoSQL方式的存储,未来还会支持更多类型的存储。而在最终用户看来,无论是哪种存储方式,在MyCat里,都是一个传统的数据库表,支持标准的SQL语句进行数据的操作,这样一来,对前端业务系统来说,可以大幅降低开发难度,提高开发速度。

    Mycat官网
    Mycat电子书籍

    1.2 使用Mycat后的结构图
    使用Mycat后的结构图

    二、Mycat中的概念

    2.1 切分

    逻辑上的切分,在物理层面,是使用多库、多表来实现切分的。

    2.1.1 Mycat垂直拆分

    垂直分库是根据数据库里面的数据表的业务进行拆分,比如:一个数据库里面既存在用户数据,又存在订单数据,那么垂直拆分可以把用户数据放入到用户库,把订单数据放到订单库。

    垂直分表是对数据表进行垂直拆分的一种方式,常见是把一个多字段的大表按常用字段和非常用字段进行拆分,每个表里面的数据记录数一般情况下是相同的,只是字段不一样,使用主键关联。
    比如原始用户表是:

    原始用户表

    垂直拆分后的表是:

    垂直拆分后的表

    垂直拆分的优点是:

    • 可以使得数据变小,一个数据块(block)就能存放更多的数据,在查询时就会减少I/O次数(每次查询时读取的Block就少)
    • 可以达到最大化利用Cache的目的,具体在垂直拆分的时候可以将不常变的字段放一起,将经常改变的放一起
    • 数据维护简单

    缺点是:

    • 主键出现冗余,需要管理冗余例
    • 会引起表连接JOIN操作(增加CPU开销)可以通过在业务服务器上进行join来减少数据库压力
    • 依然存在单表数据量过大的问题(需要水平拆分)
    • 事务处理复杂
    2.1.2 Mycat水平拆分

    水平拆分是通过某种策略将数据分片来存储,有库内分表、分库两部分,每片数据会分散到不同的MySQL表或库,达到分布式的效果,能够支持非常大的数据量。

    水平拆分表如下:

    水平拆分表

    实际情况中往往会是垂直拆分和水平拆分的结合,即将Users_A_M和Users_N_Z再拆成Users和UserExtras,这样一共四张表。

    水平拆分的优点是:

    • 不存在单库大数据和高并发的性能瓶颈
    • 应用端改造较少
    • 提高了系统的稳定性和负载能力

    缺点是:

    • 分片事务一致性难以解决
    • 跨节点Join性能差,逻辑复杂
    • 数据多次扩展难度跟维护量极大
    2.2 逻辑库 & 逻辑表
    • 逻辑库-Schema:Mycat中定义的database是逻辑上存在的,但是物理上是不存在的。
    • 逻辑表-table:Mycat中定义的table是逻辑上存在的,但是物理上是不存在的。
    2.3 数据主机 & 数据节点
    • 数据主机-dataHost:是物理MySQL存放的主机地址,可以使用主机名、IP、域名定义。
    • 数据节点-dataNode:配置物理的database,数据保存的物理节点就是database。
    2.4 分片规则

    当控制数据的时候,如何访问物理database和table,就是访问dataHost和dataNode的算法。在MyCat处理具体的数据CRUD的时候,如何访问dataHost和dataNode的算法,如哈希算法、crc32算法等。

    三、Mycat的使用

    3.1 读写分离

    原理:需要搭建主从模式,让主数据库(master)处理事务性增、改、删操作,而从数据库(slave)处理查询操作。

    Mycat配合数据库本身的复制功能,可以解决读写分离的问题。

    3.2 主从备份
    3.2.1 主从备份概念

    主从备份就是一种主备模式的数据库应用。主库数据与备库数据完全一致;实现数据的多重备份,保证数据的安全;可以在master[InnoDB]和slave[MyISAM]中使用不同的数据库引擎,实现读写的分离。

    备注:InnoDB支持事物,MyISAM不支持事物,MyISAM查询效率更高。

    3.2.2 MySQL5.5、5.6版本后本身支持主从备份

    MySQL5.5、5.6版本后本身支持主从备份,在老旧版本的MySQL数据库系统中,不支持主从备份,需要安装额外的RPM包,如果需要安装RPM包,只能在一个位置节点安装。

    3.2.3 主从备份目的
    • 实现主备模式:保证数据的安全,尽量避免数据丢失的可能。
    • 实现读写分离:使用不同的数据库引擎,实现读写分离,提高所有操作的效率。
    3.2.4 主从模式下的逻辑图

    基于日志来实现主从数据同步

    主从模式下的逻辑图
    3.3 MySQL的主从模式搭建
    3.3.1 安装MySQL

    已安装
    主库:47.115.26.11
    从库:47.105.146.74

    3.3.2 主从备份配置-master[主库]配置

    1、修改master的配置文件

    vi /etc/mysql/mysql.conf.d/mysqld.cnf
    

    注意:该配置文件由于系统环境不同,安装方式不同,版本不同,因此目录、配置文件名也可能不相同。

    2、添加server_id
    server_id是MySQL服务唯一标识,可任意配置,只要是数字即可,但master唯一标识数字必须小于slave唯一标识数字。

    3、log_bin
    开启日志功能以及日志文件命名,log_bin=master_log,变量的值就是日志文件名称,是日志文件名称的主体,MySQL数据库自动增加文件名后缀和文件类型。

    log_bin=/var/log/mysql/master_log
    server_id=1
    
    修改mysqld.cnf

    4、重启MySQL

    sudo service mysql restart
    

    5、访问MySQL

    mysql -u root -p
    

    6、创建用户
    在MySQL数据库中,为不存在的用户授权,会自动创建对应用户并授权(不需要先创建用户再授权),当前我们要创建的用户是从库访问主库使用的用户。

    IP地址不能写%,因为主从备份中,当前创建的用户是给从库slave访问主库master使用的,用户必须有指定的访问地址,不能是通用地址。

    grant all privileges on *.* to 'myslave'@'47.105.146.74' identified by 'myslave@123AC' with grant option;
    flush privileges;
    

    7、查看用户

    use mysql;
    select host,user from user;
    
    查看用户

    8、查看master信息

    show master status;
    
    查看master信息

    9、关闭防火墙或在防火墙中开放3306端口

    3.3.3 主从备份配置-slave[从库]配置

    1、修改master的配置文件

    vi /etc/mysql/mysql.conf.d/mysqld.cnf
    

    2、添加server_id
    server_id是MySQL服务唯一标识,可任意配置,只要是数字即可,但master唯一标识数字必须小于slave唯一标识数字。

    server_id=2
    

    3、重启MySQL

    sudo service mysql restart
    

    4、访问MySQL

    mysql -u root -p
    

    5、停止slave功能

    stop slave;
    

    6、配置主库信息
    需要修改的数据是依据master信息修改的,IP是master所在物理机IP,用户名和密码是master提供的slave访问用户名和密码,日志文件是在master中查看的主库信息提供的,在master中使用show master status查看日志文件名称。

    查看master信息
    // 在从库中配置主库信息
    
    change master to master_host='47.115.26.11',master_user='myslave',master_password='myslave@123AC',master_log_file='master_log.000001';
    

    7、启动slave功能

    start slave;
    

    8、查看slave配置

    show slave status \G;
    
    查看slave配置
    3.4 测试主从数据同步

    1、在主库中创建数据

    create database master_slave_test_db character set utf8mb4;
    

    2、查看主库中的数据库

    show databases;
    
    查看主库中的数据库

    可以查看到到刚才创建的master_slave_test_db 数据库

    3、查看从库中的数据库

    show databases;
    
    查看从库中的数据库

    可以查看到到刚才在主库中创建的master_slave_test_db 数据库,说明从库已经同步到主库信息了。

    注意:如果发现从库没有同步到主库的信息,检查一下master_log_file的文件名配置的是否正确并检查slave配置信息是否有异常。

    //检查master_log_file的文件名配置的是否正确
    
    // 1、在主库中执行
    show master status;
    
    // 2、在从库中执行
    show slave status \G;
    
    同步失败原因举例

    重点:根据异常信息对数据库进行了处理后(如补充从库中的数据表、字段等),需要停止slave,重新配置主库信息,再启动slave,否则会一直同步失败。

    4、在主库中创建数据表并查看

    use master_slave_test_db;
    create table t_user(id int,name varchar(45));
    show tables;
    
    在主库中创建数据表并查看

    5、查看从库中的数据表

    use master_slave_test_db;
    show tables;
    
    查看从库中的数据表

    四、安装Mycat

    4.1 安装并配置JDK

    省略

    4.2 在主库和从库上都需要处理

    1、开放3306端口
    2、保证root用户可以被Mycat访问

    grant all privileges on *.* to 'root'@'%' identified by 'root' with grant option;
    
    flush privileges;
    
    4.3 解压上传的Mycat压缩包

    MyCat我将安装到39.108.250.186这台机器上

    scp D:/temp/Mycat-server-1.6-RELEASE-20161028204710-linux.tar.gz root@39.108.250.186:/data/Mycat-server-1.6-RELEASE-20161028204710-linux.tar.gz
    
    4.4 解压
    tar -zxf Mycat-server-1.6-RELEASE-20161028204710-linux.tar.gz
    
    4.5 注意事项

    1、将Mycat下载到本地后,在windows 10上,如果设置了隐藏后缀名,文件名不会显示后缀.gz,因此上传到远程服务器时,要把文件名.gz加上。

    2、将Mycat下载到本地后,不能先用解压工具解压,再压缩成.zip文件再上传到服务器,这样传到服务器,再解压是无法运行Mycat的

    4.5 Mycat目录介绍
    • bin目录里是启动脚本
    • conf目录里是配置文件
    • catlet为MyCat的一个扩展功能
    • lib目录里是MyCat和它的依赖jar
    • logs目录里是console.log用来保存控制日志,mycatlog用来保存mycat的log4j日志

    五、Mycat配置文件

    MyCat的架构其实很好理解,Mycat是代理,Mycat后面就是物理数据库,和Web服务器的Nginx类似。对于使用者来说,访问的都是Mycat,不会接触到后端的数据库,我们现在做一个主从、读写分离,结构如下图

    结构图

    Mycat的配置文件都在conf目录里面,这里介绍几个常用的文件

    • server.xml :Mycat的配置文件,设置账号、参数等;
    • schema.xml:Mycat对应的物理数据库和数据库表的配置;
    • rule.xml:Mycat分片(分库分表)规则;
    5.1 server.xml
    5.1.1 server.xml 内容
      省略……
            <user name="root" defaultAccount="true">
                    <property name="password">123456</property>
                    <property name="schemas">TESTDB</property>
    
                    <!-- 表级 DML 权限设置 -->
                    <!--
                    <privileges check="false">
                            <schema name="TESTDB" dml="0110" >
                                    <table name="tb01" dml="0000"></table>
                                    <table name="tb02" dml="1111"></table>
                            </schema>
                    </privileges>
                     -->
            </user>
    
            <user name="user">
                    <property name="password">user</property>
                    <property name="schemas">TESTDB</property>
                    <property name="readOnly">true</property>
            </user>
    省略……
    

    如Mycat中的用户,用户可以访问的逻辑库,可以访问的逻辑表,服务端口号等

    • user:用户配置节点;
    • name:登录的用户名,也就是连接Mycat的用户名;
    • password:登录的密码,也就是连接Mycat的密码;
    • schemas:逻辑库名,这里会和schema.xml中的配置关联,多个用逗号分开,例如需要这个用户管理两个数据库db1,db2,则配置db1,db2
    • privileges:配置用户针对表的增删改查的权限;

    Mycat的server.xml配置文件默认配置了一个账号root,密码是123456,数据库是TESTDB,读写权限都有,没有针对表做任何特殊的权限。

    5.1.2 配置权限

    dml权限顺序为:insert(新增)、update(修改)、select(查询)、delete(删除),0000~1111,0为禁止权限,1为开启权限。

    5.2 schema.xml
    5.2.1 schema.xml内容

    schema.xml是最主要的配置文件,首先看默认的配置文件

    <?xml version="1.0"?>
    <!DOCTYPE mycat:schema SYSTEM "schema.dtd">
    <mycat:schema xmlns:mycat="http://io.mycat/">
    
            <schema name="TESTDB" checkSQLschema="false" sqlMaxLimit="100">
                    <!-- auto sharding by id (long) -->
                    <table name="travelrecord" dataNode="dn1,dn2,dn3" rule="auto-sharding-long" />
    
                    <!-- global table is auto cloned to all defined data nodes ,so can join
                            with any table whose sharding node is in the same data node -->
                    <table name="company" primaryKey="ID" type="global" dataNode="dn1,dn2,dn3" />
                    <table name="goods" primaryKey="ID" type="global" dataNode="dn1,dn2" />
                    <!-- random sharding using mod sharind rule -->
                    <table name="hotnews" primaryKey="ID" autoIncrement="true" dataNode="dn1,dn2,dn3"
                               rule="mod-long" />
                    <!-- <table name="dual" primaryKey="ID" dataNode="dnx,dnoracle2" type="global"
                            needAddLimit="false"/> <table name="worker" primaryKey="ID" dataNode="jdbc_dn1,jdbc_dn2,jdbc_dn3"
                            rule="mod-long" /> -->
                    <table name="employee" primaryKey="ID" dataNode="dn1,dn2"
                               rule="sharding-by-intfile" />
                    <table name="customer" primaryKey="ID" dataNode="dn1,dn2"
                               rule="sharding-by-intfile">
                            <childTable name="orders" primaryKey="ID" joinKey="customer_id"
                                                    parentKey="id">
                                    <childTable name="order_items" joinKey="order_id"
                                                            parentKey="id" />
                            </childTable>
                            <childTable name="customer_addr" primaryKey="ID" joinKey="customer_id"
                                                    parentKey="id" />
                    </table>
                    <!-- <table name="oc_call" primaryKey="ID" dataNode="dn1$0-743" rule="latest-month-calldate"
                            /> -->
            </schema>
            <!-- <dataNode name="dn1$0-743" dataHost="localhost1" database="db$0-743"
                    /> -->
            <dataNode name="dn1" dataHost="localhost1" database="db1" />
            <dataNode name="dn2" dataHost="localhost1" database="db2" />
            <dataNode name="dn3" dataHost="localhost1" database="db3" />
            <!--<dataNode name="dn4" dataHost="sequoiadb1" database="SAMPLE" />
             <dataNode name="jdbc_dn1" dataHost="jdbchost" database="db1" />
            <dataNode       name="jdbc_dn2" dataHost="jdbchost" database="db2" />
            <dataNode name="jdbc_dn3"       dataHost="jdbchost" database="db3" /> -->
            <dataHost name="localhost1" maxCon="1000" minCon="10" balance="0"
                              writeType="0" dbType="mysql" dbDriver="native" switchType="1"  slaveThreshold="100" maxRetryCount="4">
                    <heartbeat>select user()</heartbeat>
                    <!-- can have multi write hosts -->
                    <writeHost host="hostM1" url="localhost:3306" user="root"
                                       password="123">
                            <!-- can have multi read hosts -->
                            <readHost host="hostS2" url="localhost:3306" user="root" password="123" />
                    </writeHost>
    
                   <writeHost host="hostS1" url="localhost:3306" user="root"
                                       password="123" />
                    <!-- <writeHost host="hostM2" url="localhost:3316" user="root" password="123456"/> -->
            </dataHost>
           
    </mycat:schema>
    

    在配置文件中可以定义读写分离,逻辑库,逻辑表,dataHost,dataNode等信息。

    • schema:配置逻辑库,name与server.xml中schema对应;
    • dataNode:定义数据节点的标签,也就是分库相关配置;
    • dataHost:物理数据库,真正存储数据的数据库;
    5.2.2 节点与属性介绍
    5.2.2.1 标签schema

    配置逻辑库的标签

    1、属性name
    逻辑库名称

    2、属性checkSQLshema
    是否检测SQL语法中的schema信息,如:Mycat逻辑库名称A,dataNode名称B;
    SQL:select * from A.table;
    checkSQLshema值是true,Mycat发送到数据库的SQL是:select * from table;
    checkSQLshema值是false,Mycat发送到数据库的SQL是:select * from A.table;

    3、属性sqlMaxLimit
    Mycat在执行SQL的时候,如果SQL语句中没有limit子句,自动增加limit子句,避免一次性得到过多的数据,影响效率,limit子句的限制数量默认配置为100,如果SQL中有具体的limit子句,当前属性失效。

    5.2.2.2 标签table

    定义逻辑表的标签

    1、属性name
    逻辑表名

    2、属性dataNode
    数据节点名称,即物理数据库中的database名称,多个名称使用逗号分隔。

    3、属性rule
    分片规则名称,具体的规则名称参考rule.xml配置文件。

    5.2.2.3 标签dataNode

    定义数据节点的标签

    1、属性name
    数据节点名称,是定义的逻辑名称,对应具体的物理数据库database

    2、属性dataHost
    引用dataHost标签的name值,代表使用的物理数据库所在位置和配置信息

    3、属性database
    在dataHost物理机中,具体的物理数据库database名称

    5.2.2.4 标签dataHost

    定义数据主机的标签

    1、属性name
    定义逻辑上的数据主机名称

    2、属性maxCon/minCon
    最大连接数,max connections
    最小连接数,min connections

    3、属性dbType
    数据库类型:mysql数据库

    4、属性dbDriver
    数据库驱动类型,native,使用mycat提供的本地驱动。

    5.3 rule.xml
    5.3.1 rule.xml内容
    <?xml version="1.0" encoding="UTF-8"?>
    <!DOCTYPE mycat:rule SYSTEM "rule.dtd">
    <mycat:rule xmlns:mycat="http://io.mycat/">
            <tableRule name="rule1">
                    <rule>
                            <columns>id</columns>
                            <algorithm>func1</algorithm>
                    </rule>
            </tableRule>
    
            <tableRule name="rule2">
                    <rule>
                            <columns>user_id</columns>
                            <algorithm>func1</algorithm>
                    </rule>
            </tableRule>
    
            <tableRule name="sharding-by-intfile">
                    <rule>
                            <columns>sharding_id</columns>
                            <algorithm>hash-int</algorithm>
                    </rule>
            </tableRule>
            <tableRule name="auto-sharding-long">
                    <rule>
                            <columns>id</columns>
                            <algorithm>rang-long</algorithm>
                    </rule>
            </tableRule>
            <tableRule name="mod-long">
                    <rule>
                            <columns>id</columns>
                            <algorithm>mod-long</algorithm>
                    </rule>
            </tableRule>
            <tableRule name="sharding-by-murmur">
                    <rule>
                            <columns>id</columns>
                            <algorithm>murmur</algorithm>
                    </rule>
            </tableRule>
            <tableRule name="crc32slot">
             <rule>
                            <columns>id</columns>
                            <algorithm>crc32slot</algorithm>
                    </rule>
            </tableRule>
            <tableRule name="sharding-by-month">
                    <rule>
                            <columns>create_time</columns>
                            <algorithm>partbymonth</algorithm>
                    </rule>
            </tableRule>
            <tableRule name="latest-month-calldate">
                    <rule>
                            <columns>calldate</columns>
                            <algorithm>latestMonth</algorithm>
                    </rule>
            </tableRule>
    
            <tableRule name="auto-sharding-rang-mod">
                    <rule>
                            <columns>id</columns>
                            <algorithm>rang-mod</algorithm>
                    </rule>
            </tableRule>
    
            <tableRule name="jch">
                    <rule>
                            <columns>id</columns>
                            <algorithm>jump-consistent-hash</algorithm>
                    </rule>
            </tableRule>
    
            <function name="murmur"
                    class="io.mycat.route.function.PartitionByMurmurHash">
                    <property name="seed">0</property><!-- 默认是0 -->
                    <property name="count">2</property><!-- 要分片的数据库节点数量,必须指定,否则没法分片 -->
                    <property name="virtualBucketTimes">160</property><!-- 一个实际的数据库节点被映射为这么多虚拟节点,默认是160倍,也就是虚拟节点数是物理节点数的160倍 -->
                    <!-- <property name="weightMapFile">weightMapFile</property> 节点的权重,没有指定权重的节点默认是1。以properties文件的格式填写,以从0开始到count-1的整数值也就是节点索引为key,以节点权重值为值。所有权重值必须是正整数,否则以1代替 -->
                    <!-- <property name="bucketMapPath">/etc/mycat/bucketMapPath</property>
                            用于测试时观察各物理节点与虚拟节点的分布情况,如果指定了这个属性,会把虚拟节点的murmur hash值与物理节点的映射按行输出到这个文件,没有默认值,如果不指定,就不会输出任何东西 -->
            </function>
    
            <function name="crc32slot"
                              class="io.mycat.route.function.PartitionByCRC32PreSlot">
                    <property name="count">2</property><!-- 要分片的数据库节点数量,必须指定,否则没法分片 -->
            </function>
            <function name="hash-int"
                    class="io.mycat.route.function.PartitionByFileMap">
    
             <function name="hash-int"
                    class="io.mycat.route.function.PartitionByFileMap">
                    <property name="mapFile">partition-hash-int.txt</property>
            </function>
            <function name="rang-long"
                    class="io.mycat.route.function.AutoPartitionByLong">
                    <property name="mapFile">autopartition-long.txt</property>
            </function>
            <function name="mod-long" class="io.mycat.route.function.PartitionByMod">
                    <!-- how many data nodes -->
                    <property name="count">3</property>
            </function>
    
            <function name="func1" class="io.mycat.route.function.PartitionByLong">
                    <property name="partitionCount">8</property>
                    <property name="partitionLength">128</property>
            </function>
            <function name="latestMonth"
                    class="io.mycat.route.function.LatestMonthPartion">
                    <property name="splitOneDay">24</property>
            </function>
            <function name="partbymonth"
                    class="io.mycat.route.function.PartitionByMonth">
                    <property name="dateFormat">yyyy-MM-dd</property>
                    <property name="sBeginDate">2015-01-01</property>
            </function>
    
            <function name="rang-mod" class="io.mycat.route.function.PartitionByRangeMod">
                    <property name="mapFile">partition-range-mod.txt</property>
            </function>
    
            <function name="jump-consistent-hash" class="io.mycat.route.function.PartitionByJumpConsistentHash">
                    <property name="totalBuckets">3</property>
            </function>
    </mycat:rule>
    
    

    rule.xml是用于定义分片规则的配置文件,Mycat默认的分片规则是auto-sharding-long:以500万为单位实现分片规则。逻辑库A对应dataNode-db1和db2,1500万保存在db1中,500万零11000万保存在db2中,1000万零1~1500万保存在db1中,以此类推。

    六、实现读写分离

    6.1 配置读写分离
    6.1.1 schema.xml配置
    <?xml version="1.0"?>
    <!DOCTYPE mycat:schema SYSTEM "schema.dtd">
    <mycat:schema xmlns:mycat="http://io.mycat/">
    
        <schema name="mysql_master_slave_db" checkSQLschema="false" sqlMaxLimit="100">
        
            <table name="t_user" dataNode="dn1" />
            
        </schema>
    
        <dataNode name="dn1" dataHost="localhost1" database="master_slave_test_db" />
    
        <dataHost name="localhost1" maxCon="1000" minCon="10" balance="3"
                  writeType="0" dbType="mysql" dbDriver="native" switchType="1"  slaveThreshold="100">
            <heartbeat>select user()</heartbeat>
            <writeHost host="hostM1" url="47.115.26.11:3306" user="root" password="your password">
                <readHost host="hostS2" url="47.105.146.74:3306" user="root" password="your password" />
            </writeHost>
        
        </dataHost>
    </mycat:schema>
    
    6.1.2 balance
    • 0:不开启读写分离机制,所有读操作都发送到当前可用的writeHost上;
    • 1:全部的readHost与stand by writeHost参与select 语句的负载均衡;
    • 2:所有读操作都随机的在writeHost、readHost上分发;
    • 3:所有读请求随机的分发到writeHost对应的readHost上执行,writeHost不负担读压力;
    6.1.3 server.xml配置(部分)
    <user name="root">
            <property name="password">123456</property>
            <property name="schemas">mysql_master_slave_db</property>
            
            <!-- 表级 DML 权限设置 -->
            <!--        
            <privileges check="false">
                <schema name="TESTDB" dml="0110" >
                    <table name="tb01" dml="0000"></table>
                    <table name="tb02" dml="1111"></table>
                </schema>
            </privileges>       
             -->
        </user>
    
        <user name="user">
            <property name="password">user</property>
            <property name="schemas">mysql_master_slave_db</property>
            <property name="readOnly">true</property>
        </user>
    
    6.2 Mycat命令
    // 启动
    bin/mycat start
    
    //停止
    bin/mycat stop
    
    //重启
    bin/mycat restart
    
    //查看状态
    bin/mycat status
    
    
    6.3 访问Mycat方式

    可以使用命令行访问或客户端软件访问,和连接MySQL一样,Mycat的端口是8066,管理端口默认为9066。

    1、用命令行访问

    mysql -uroot -p123456 -P9066 -h127.0.0.1
    
    image.png

    2、用客户端软件访问

    我用MySQL Workbench连接Mycat,一直提示密码错误,后来换成用Navicat去连Mycat就连成功了,估计是MySQL Workbench连接Mycat有问题。

    MySQL Workbench连接失败

    用Navicat连接Mycat成功


    用Navicat连接Mycat成功

    同时也用Navicat连接主库(master)和从库(slave)


    Navicat连接主库、从库
    6.4 查看Mycat日志

    logs/wrapper.log日志中记录的是所有Mycat操作,查看的时候主要看异常信息caused by信息

    6.5 测试读写分离
    6.5.1 操作mycat插入数据

    我们连接mycat,并在mysql_master_slave_db数据库的t_user表中插入两条数据

    insert into t_user(id,name) values(1,'张三');
    insert into t_user(id,name) values(2,'李四');
    
    select * from t_user;
    
    mycat插入数据
    6.5.2 操作master、slave查看数据

    master

    master

    slave


    slave

    我们可以看到,master、slave库中都已经能查到刚才插入的两条数据了。数据插入的时的逻辑大致是这样的:操作mycat--->插入语句走的是master数据库--->数据插入到master后,slave库再同步该数据(同步是通过Binary log、Relay log实现的)。

    6.5.3 验证读操作查询的是slave库

    我们通过mycat执行查询操作,查到的数据是两条,那这两条到底是从master中查询到的,还是从slave库中查询到的呢?我们可以这样操作,直接操作slave库,将李四改成王五,我们通过mycat再来查数据

    修改slave数据 查看mycat数据

    到此,我们的读写分离就实现好了。

    七、Mycat分库

    7.1 分片规则
    7.1.1 auto-sharding-long 范围约定

    以500万为单位实现分片规则。逻辑库A对应dataNode-db1和db2,1500万保存在db1中,500万零11000万保存在db2中,1000万零1~1500万保存在db1中,以此类推。

    7.1.2 crc32slot规则

    在CRUD操作时,根据具体数据的crc32算法计算,数据应该保存在哪一个dataNode中

    7.2 配置分片规则需要注意的地方

    1、<columns> id </columns> 中推荐配置主键列

    2、所有的tableRule只能使用一次,如果需要为多个表配置相同的分片规则,那么需要在此重新定义该规则。

    3、在crc32slot算法中的分片数量(数据库数量)一旦给定,Mycat会将该分片数量和slor的取值范围保存到文件中,在修改分片数量时是不会生效的,需要将该文件删除,文件位置位于conf目录中的ruledata目录中。

    7.3 配置分库

    需求:
    1、在master中创建3个数据库;
    2、在Mycat中配置分库

    7.3.1 创建数据库
    create database demo1 default character set utf8;
    create database demo2 default character set utf8;
    create database demo3 default character set utf8;
    

    slave也会自动同步创建好这三个库

    创建数据库
    7.3.2 创建t_user表

    在master的三个库中创建t_user表

    create table `t_user`(
        `id` int(11) not null,
        `name` varchar(30) default null,
        primary key (`id`)
    )engine = InnoDB default charset=utf8;
    
    在master的三个库中创建t_user表
    7.3.3 修改配置文件

    1、schema.xml

    <?xml version="1.0"?>
    <!DOCTYPE mycat:schema SYSTEM "schema.dtd">
    <mycat:schema xmlns:mycat="http://io.mycat/">
    
        <schema name="mysql_master_slave_db" checkSQLschema="false" sqlMaxLimit="100">
        
            <table name="t_user" dataNode="dn1,dn2,dn3" rule="crc32slot"/>
            
        </schema>
    
        <dataNode name="dn1" dataHost="localhost1" database="demo1" />
        <dataNode name="dn2" dataHost="localhost1" database="demo2" />
        <dataNode name="dn3" dataHost="localhost1" database="demo3" />
    
        <dataHost name="localhost1" maxCon="1000" minCon="10" balance="3"
                  writeType="0" dbType="mysql" dbDriver="native" switchType="1"  slaveThreshold="100">
            <heartbeat>select user()</heartbeat>
            <writeHost host="hostM1" url="47.115.26.11:3306" user="root" password="your password">
                <readHost host="hostS2" url="47.105.146.74:3306" user="root" password="your password" />
            </writeHost>
        
        </dataHost>
    </mycat:schema>
    

    2、rule.xml
    将crc32slot 分片数量改成3

        <function name="crc32slot"
                  class="io.mycat.route.function.PartitionByCRC32PreSlot">
            <property name="count">3</property><!-- 要分片的数据库节点数量,必须指定,否则没法分片 -->
        </function>
    

    3、重启Mycat

    cd /data/mycat
    
    bin/mycat restart
    
    bin/mycat status
    
    7.4 出现_slot列问题

    我们现在操作mycat往t_user表里插入数据

    insert into t_user(id,name) values(1,'admin');
    
    image.png

    执行结果是插入失败,提示Unknown column '_slot' in 'field list',这个错误的原因是,当我们用分库的方式去做数据存储时,Mycat会在我们的数据表中自动添加_slot这一个列,这一列记录的就是通过crc32slot算法计算出来的值。我们刚才是直接操作master来创建的t_user表,这样t_user表中就不会有_slot这一列。

    当我们使用Mycat后,我们对所有表的创建应该在Mycat中完成。正确的操作流程是:先在mycat中配置逻辑库、逻辑表,然后在mycat中创建物理表,master库中会自动创建物理表,slave会自动同步。

    7.5 解决_slot列问题

    1、现在我们操作master将三个数据库里的t_user删除(slave库中的t_user表也会自动删除)

    2、我们操作mycat,执行t_user建表语句

    mycat建表

    3、我们再去查看master和slave,可以看到三个库中都已经有t_user表了,并且多了_slot列

    master查看t_user表
    7.6 插入数据,实现数据分片

    1、操作mycat 执行插入SQL

    insert into t_user(id,name) values(1,'admin');
    
    操作mycat 执行插入SQL

    操作master,我们发现刚才这条数据插入到demo2这个库中了

    demo1 demo2 demo3

    2、操作mycat 我们再插入一条数据

    insert into t_user(id,name) values(2,'张三');
    

    我们发现插入的还是demo2库中,但随着ID值的变化,后面的数据会被分摊到另外两个库中,到此,分库的功能我们就实现了。

    7.7 注意事项

    1、使用Mycat实现分库时,先在Mycat中定义逻辑库与逻辑表,然后在Mycat的链接中执行创建表的命令必须要在Mycat中运行。因为Mycat在创建表时,会在表中添加一个新的列,列名为_slot。

    2、使用Mycat插入数据时,语句中必须要指定所有的列,即便是一个完全项插入也不能省略列名。

    资料来源:MyCat基础入门到精通

    最后给大家送波福利

    阿里云折扣快速入口

    阿里云折扣快速入口

    相关文章

      网友评论

          本文标题:Mycat基础入门

          本文链接:https://www.haomeiwen.com/subject/jaqfektx.html