美文网首页
分库分表

分库分表

作者: 康俊1024 | 来源:发表于2020-02-21 18:43 被阅读0次

分库分表

  1. 为什么要分库分表?
  • 超大容量问题
  • 性能问题
  1. 如何去做到
  • 垂直切分
    ①垂直分库; 解决的是表过多的问题
    ②垂直分表; 解决单表列过多的问题
  • 水平切分
    大数据表拆成小表
  1. 常见的拆分策略
  • 垂直切分
    分片技术
  • 水平切分
    ①一致性hash
    ②范围切分 可以按照ID
    ③日期拆分
  1. 拆分以后带来的问题
  • 跨库join的问题
    ①设计的时候考虑到应用层的join问题。
    ②在服务层去做调用;
    A服务里查询到一个list
    bservice.select(list);
    ③全局表
    数据变更比较少的基于全局应用的表
    ④做字段冗余(空间换时间的做法)
    订单表。 商家id 商家名称
    商家名称变更- 定时任务、任务通知
  • 唯一主键问题
    ①用自增id做主键
    ②UUID 性能比较低
    ③snowflake
    ④mongoDB
    ⑤zookeeper
    ⑥数据库表
  • 分布式事务问题
    多个数据库表之间保证原子性 性能问题; 互联网公司用强一致性分布式事务比较少

Mysql的主从

  • 数据库的版本5.7版本
  • 安装以后文件对应的目录
    mysql的数据文件和二进制文件: /var/lib/mysql/
    mysql的配置文件: /etc/my.cnf
    mysql的日志文件: /var/log/mysql.log
  • 152 为master
    ①创建一个用户’repl’,并且允许其他服务器可以通过该用户远程访问master,通过该用户去读取二进制数据,实现数据同步
    Create user repl identified by ‘repl; repl用户必须具有REPLICATION SLAVE权限,除此之外其他权限都不需要
    GRANT REPLICATION SLAVE ON *.* TO ‘repl’@’%’ IDENTIFIED BY ‘repl’;
    ②修改140 my.cnf配置文件,在[mysqld] 下添加如下配置
    log-bin=mysql-bin //启用二进制日志文件
    server-id=130 //服务器唯一ID
    ③重启数据库 systemctl restart mysqld
    ④登录到数据库,通过show master status 查看master的状态信息
  • 153 为slave
    ①修改142 my.cnf配置文件, 在[mysqld]下增加如下配置
    server-id=132 //服务器id,唯一
    relay-log=slave-relay-bin
    relay-log-index=slave-relay-bin.index
    read_only=1
    ②重启数据库: systemctl restart mysqld
    ③连接到数据库客户端,通过如下命令建立同步连接
    change master to master_host=’192.168.100.152’, master_port=3306,master_user=’repl’,master_password=’repl’,master_log_file=’mysql-bin.000001’,master_log_pos=0;
    master_log_filemaster_log_pos从master的show master status可以找到对应的值,不能随便写。
    ④执行 start slave
    ⑤show slave status\G;查看slave服务器状态,当如下两个线程状态为yes,表示主从复制配置成功
    Slave_IO_Running=Yes
    Slave_SQL_Running=Yes

主从同步的原理

①master记录二进制日志。在每个事务更新数据完成之前,master在二日志记录这些改变。MySQL将事务串行的写入二进制日志,即使事务中的语句都是交叉执行的。在事件写入二进制日志完成后,master通知存储引擎提交事务
②slave将master的binary log拷贝到它自己的中继日志。首先,slave开始一个工作线程——I/O线程。I/O线程在master上打开一个普通的连接,然后开始binlog dump process。Binlog dump process从master的二进制日志中读取事件,如果已经跟上master,它会睡眠并等待master产生新的事件。I/O线程将这些事件写入中继日志
③SQL线程从中继日志读取事件,并重放其中的事件而更新slave的数据,使其与master中的数据一致

  • binlog
    用来记录mysql的数据更新或者潜在更新(update xxx where id=x effect row 0);
    文件内容存储:/var/lib/mysql
    mysqlbinlog --base64-output=decode-rows -v mysql-bin.000001 //查看binlog的内容
  • binlog的格式
    ①statement : 基于sql语句的模式。update table set name =””; effect row 1000; uuid、now() other function
    ②row: 基于行模式; 存在1000条数据变更; 记录修改以后每一条记录变化的值
    ③mixed: 混合模式,由mysql自动判断处理
    修改binlog_formater,通过在mysql客户端输入如下命令可以修改
    set global binlog_format=’row/mixed/statement’;
    或者在vim /etc/my.cnf 的[mysqld]下增加binlog_format=‘mixed’
  • 主从同步的延时问题
    ①当master库tps比较高的时候,产生的DDL数量超过slave一个sql线程所能承受的范围,或者slave的大型query语句产生锁等待
    ②网络传输: bin文件的传输延迟
    ③磁盘的读写耗时:文件通知更新、磁盘读取延迟、磁盘写入延迟
  • 解决方案
    ①在数据库和应用层增加缓存处理,优先从缓存中读取数据
    ②减少slave同步延迟,可以修改slave库sync_binlog属性;
    sync_binlog=0 文件系统来调度把binlog_cache刷新到磁盘
    sync_binlog=n
    ③增加延时监控
    Nagios做网络监控
    mk-heartbeat

相关文章

网友评论

      本文标题:分库分表

      本文链接:https://www.haomeiwen.com/subject/gogcqhtx.html