MySQL-MHA高可用技术

作者: linux_豪哥 | 来源:发表于2019-09-29 15:49 被阅读0次

MySQL-MHA高可用技术
MySQL-MHA高可用技术
MySQL-MHA高可用技术
今日份打卡220/365
今日份打卡220/365
聊聊服务的高可用
redis主从+keepalived实现高可用技术（转）
《亿级流量网站架构核心技术》
Keepalived实现高可用技术
高可用系统技术梳理

1. 主从复制架构演变介绍

1.1 基本结构

（1）一主一从
（2）一主多从
（3）多级主从
（4）双主
（5）循环复制

1.2 高级应用架构演变

1.2.1 高性能架构

读写分离架构(读性能较高)
代码级别
MySQL proxy (Atlas,mysql router,proxySQL(percona),maxscale)、
amoeba(taobao)
xx-dbproxy等。
分布式架构(读写性能都提高):
分库分表——cobar--->TDDL(头都大了),DRDS
Mycat--->DBLE自主研发等。
NewSQL-->TiDB

1.2.2 高可用架构

（3）单活:MMM架构——mysql-mmm（google）
（4）单活:MHA架构——mysql-master-ha（日本DeNa）,T-MHA
（5）多活:MGR ——5.7 新特性 MySQL Group replication(5.7.17) --->Innodb Cluster  
（6）多活:MariaDB Galera Cluster架构,(PXC)Percona XtraDB Cluster、MySQL Cluster(Oracle rac)架构

2. 高可用MHA *****

2.1 MHA介绍

  MHA（Master High Availability）目前在MySQL高可用方面是一个相对成熟的解决方案，它由日本DeNA公司的youshimaton（现就职于Facebook公司）开发，是一套优秀的作为MySQL高可用性环境下故障切换和主从提升的高可用软件
该软件由两部分组成：MHA Manager（管理节点）和MHA Node（数据节点）。MHA Manager可以单独部署在一台独立的机器上管理多个master-slave集群，也可以部署在一台slave节点上。MHA Node运行在每台MySQL服务器上，MHA Manager会定时探测集群中的master节点，当master出现故障时，它可以自动将最新数据的slave提升为新的master，然后将所有其他的slave重新指向新的master。整个故障转移过程对应用程序完全透明。
架构介绍：
数据库节点，必须至少是一主两从独立实例
目前MHA主要支持一主多从的架构。要搭建MHA，要求一个复制集群中必须最少有三台数据库服务器，一主二从，即一台充当master，一台充当备用master，另外一台充当从库

2.2 架构介绍:

1主2从，master：db01   slave：db02   db03 ）：
MHA 高可用方案软件构成
Manager软件：选择一个从节点安装
Node软件：所有节点都要安装

2.3 MHA软件构成（perl语言）

Manager工具包主要包括以下几个工具：
masterha_manger             启动MHA 
masterha_check_ssh      检查MHA的SSH配置状况 
masterha_check_repl         检查MySQL复制状况 
masterha_master_monitor     检测master是否宕机 
masterha_check_status       检测当前MHA运行状态 
masterha_master_switch  控制故障转移（自动或者手动）
masterha_conf_host      添加或删除配置的server信息

Node工具包主要包括以下几个工具：
这些工具通常由MHA Manager的脚本触发，无需人为操作
save_binary_logs            保存和复制master的二进制日志 
apply_diff_relay_logs       识别差异的中继日志事件并将其差异的事件应用于其他的
purge_relay_logs            清除中继日志（不会阻塞SQL线程）

2.4 MHA环境搭建

2.4.1 规划:

主库: 51    node 
从库: 
52      node
53      node    manager

2.4.2 准备环境（略。1主2从GTID）

2.4.3 配置关键程序软连接

mha只能调用/usr/bin/mysql和/usr/bin/mysqlbinlog

ln -s /application/mysql/bin/mysqlbinlog    /usr/bin/mysqlbinlog
ln -s /application/mysql/bin/mysql   /usr/bin/mysql

2.4.4 配置各节点互信

主库宕机，需要将宕机主库新的事务scp到新的主库保证数据的一致性，互信之后就不用交互了。
db01：
rm -rf /root/.ssh 
ssh-keygen
cd /root/.ssh 
mv id_rsa.pub authorized_keys
scp  -r  /root/.ssh  10.0.0.52:/root 
scp  -r  /root/.ssh  10.0.0.53:/root 
各节点验证
db01:
ssh 10.0.0.51 date
ssh 10.0.0.52 date
ssh 10.0.0.53 date
db02:
ssh 10.0.0.51 date
ssh 10.0.0.52 date
ssh 10.0.0.53 date
db03:
ssh 10.0.0.51 date
ssh 10.0.0.52 date
ssh 10.0.0.53 date

2.4.5 安装软件

下载mha软件

mha官网：https://code.google.com/archive/p/mysql-master-ha/
github下载地址：https://github.com/yoshinorim/mha4mysql-manager/wiki/Downloads

所有节点安装Node软件依赖包

yum install perl-DBD-MySQL -y
rpm -ivh mha4mysql-node-0.56-0.el6.noarch.rpm

在db01主库中创建mha需要的用户

 grant all privileges on *.* to mha@'10.0.0.%' identified by 'mha';

Manager软件安装（db03）

yum install -y perl-Config-Tiny epel-release perl-Log-Dispatch perl-Parallel-ForkManager perl-Time-HiRes
rpm -ivh mha4mysql-manager-0.56-0.el6.noarch.rpm

2.4.6 配置文件准备(db03)

创建配置文件目录
 mkdir -p /etc/mha
创建日志目录
 mkdir -p /var/log/mha/app1
编辑mha配置文件
vim /etc/mha/app1.cnf
[server default]
manager_log=/var/log/mha/app1/manager        运行日志 
manager_workdir=/var/log/mha/app1            日志目录        
master_binlog_dir=/data/binlog               主库binlog日志目录
user=mha                                     mha用户      
password=mha                                 mha用户密码
ping_interval=2                              mha探测主库心跳间隔时间这里是2秒（默认探测3次都失败就认为主库宕机了）
repl_password=123                            复制用户密码
repl_user=repl                               复制用户（主库宕掉，mha构建新主从时需要用到复制用户）
ssh_user=root                                互信用户      
[server1]                                    节点信息（node）mha会自动检验哪个是主库哪个是从库 
hostname=10.0.0.51
port=3306                                  
[server2]            
hostname=10.0.0.52
port=3306
[server3]
hostname=10.0.0.53
port=3306

2.4.7 状态检查

状态检查（db03）

检查互信
[root@db03 ~]# masterha_check_ssh  --conf=/etc/mha/app1.cnf 
Fri Apr 19 16:39:34 2019 - [warning] Global configuration file /etc/masterha_default.cnf not found. Skipping.
Fri Apr 19 16:39:34 2019 - [info] Reading application default configuration from /etc/mha/app1.cnf..
Fri Apr 19 16:39:34 2019 - [info] Reading server configuration from /etc/mha/app1.cnf..
Fri Apr 19 16:39:34 2019 - [info] Starting SSH connection tests..
Fri Apr 19 16:39:35 2019 - [debug] 
Fri Apr 19 16:39:34 2019 - [debug]  Connecting via SSH from root@10.0.0.51(10.0.0.51:22) to root@10.0.0.52(10.0.0.52:22)..
Fri Apr 19 16:39:34 2019 - [debug]   ok.
Fri Apr 19 16:39:34 2019 - [debug]  Connecting via SSH from root@10.0.0.51(10.0.0.51:22) to root@10.0.0.53(10.0.0.53:22)..
Fri Apr 19 16:39:35 2019 - [debug]   ok.
Fri Apr 19 16:39:36 2019 - [debug] 
Fri Apr 19 16:39:35 2019 - [debug]  Connecting via SSH from root@10.0.0.52(10.0.0.52:22) to root@10.0.0.51(10.0.0.51:22)..
Fri Apr 19 16:39:35 2019 - [debug]   ok.
Fri Apr 19 16:39:35 2019 - [debug]  Connecting via SSH from root@10.0.0.52(10.0.0.52:22) to root@10.0.0.53(10.0.0.53:22)..
Fri Apr 19 16:39:35 2019 - [debug]   ok.
Fri Apr 19 16:39:37 2019 - [debug] 
Fri Apr 19 16:39:35 2019 - [debug]  Connecting via SSH from root@10.0.0.53(10.0.0.53:22) to root@10.0.0.51(10.0.0.51:22)..
Fri Apr 19 16:39:35 2019 - [debug]   ok.
Fri Apr 19 16:39:35 2019 - [debug]  Connecting via SSH from root@10.0.0.53(10.0.0.53:22) to root@10.0.0.52(10.0.0.52:22)..
Fri Apr 19 16:39:36 2019 - [debug]   ok.
Fri Apr 19 16:39:37 2019 - [info] All SSH connection tests passed successfully.
检查主从复制是否建立好
[root@db03 ~]# masterha_check_repl  --conf=/etc/mha/app1.cnf 
Fri Apr 19 16:40:50 2019 - [warning] Global configuration file /etc/masterha_default.cnf not found. Skipping.
Fri Apr 19 16:40:50 2019 - [info] Reading application default configuration from /etc/mha/app1.cnf..
Fri Apr 19 16:40:50 2019 - [info] Reading server configuration from /etc/mha/app1.cnf..
Fri Apr 19 16:40:50 2019 - [info] MHA::MasterMonitor version 0.56.
Fri Apr 19 16:40:51 2019 - [info] GTID failover mode = 1
Fri Apr 19 16:40:51 2019 - [info] Dead Servers:
Fri Apr 19 16:40:51 2019 - [info] Alive Servers:
Fri Apr 19 16:40:51 2019 - [info]   10.0.0.51(10.0.0.51:3306)
Fri Apr 19 16:40:51 2019 - [info]   10.0.0.52(10.0.0.52:3306)
Fri Apr 19 16:40:51 2019 - [info]   10.0.0.53(10.0.0.53:3306)
Fri Apr 19 16:40:51 2019 - [info] Alive Slaves:
Fri Apr 19 16:40:51 2019 - [info]   10.0.0.52(10.0.0.52:3306)  Version=5.7.20-log (oldest major version between slaves) log-bin:enabled
Fri Apr 19 16:40:51 2019 - [info]     GTID ON
Fri Apr 19 16:40:51 2019 - [info]     Replicating from 10.0.0.51(10.0.0.51:3306)
Fri Apr 19 16:40:51 2019 - [info]   10.0.0.53(10.0.0.53:3306)  Version=5.7.20-log (oldest major version between slaves) log-bin:enabled
Fri Apr 19 16:40:51 2019 - [info]     GTID ON
Fri Apr 19 16:40:51 2019 - [info]     Replicating from 10.0.0.51(10.0.0.51:3306)
Fri Apr 19 16:40:51 2019 - [info] Current Alive Master: 10.0.0.51(10.0.0.51:3306)
Fri Apr 19 16:40:51 2019 - [info] Checking slave configurations..
Fri Apr 19 16:40:51 2019 - [info]  read_only=1 is not set on slave 10.0.0.52(10.0.0.52:3306).
Fri Apr 19 16:40:51 2019 - [info]  read_only=1 is not set on slave 10.0.0.53(10.0.0.53:3306).
Fri Apr 19 16:40:51 2019 - [info] Checking replication filtering settings..
Fri Apr 19 16:40:51 2019 - [info]  binlog_do_db= , binlog_ignore_db= 
Fri Apr 19 16:40:51 2019 - [info]  Replication filtering check ok.
Fri Apr 19 16:40:51 2019 - [info] GTID (with auto-pos) is supported. Skipping all SSH and Node package checking.
Fri Apr 19 16:40:51 2019 - [info] Checking SSH publickey authentication settings on the current master..
Fri Apr 19 16:40:51 2019 - [info] HealthCheck: SSH to 10.0.0.51 is reachable.
Fri Apr 19 16:40:51 2019 - [info] 
10.0.0.51(10.0.0.51:3306) (current master)
 +--10.0.0.52(10.0.0.52:3306)
 +--10.0.0.53(10.0.0.53:3306)

Fri Apr 19 16:40:51 2019 - [info] Checking replication health on 10.0.0.52..
Fri Apr 19 16:40:51 2019 - [info]  ok.
Fri Apr 19 16:40:51 2019 - [info] Checking replication health on 10.0.0.53..
Fri Apr 19 16:40:51 2019 - [info]  ok.
Fri Apr 19 16:40:51 2019 - [warning] master_ip_failover_script is not defined.
Fri Apr 19 16:40:51 2019 - [warning] shutdown_script is not defined.
Fri Apr 19 16:40:51 2019 - [info] Got exit code 0 (Not master dead).
MySQL Replication Health is OK.

2.4.8 开启MHA(db03)：

nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover  < /dev/null> /var/log/mha/app1/manager.log 2>&1 &

--conf    指定要运行的配置文件
--remove_dead_master_conf   当主库宕机了，会自动把故障的节点信息从配置文件中去掉。
--ignore_last_failover   默认两次切换要间隔8小时，8小时内不能切换，但加上这个参数就可以忽略上次切换跟时间。

2.4.9 查看MHA状态

[root@db03 ~]# masterha_check_status --conf=/etc/mha/app1.cnf
app1 (pid:4719) is running(0:PING_OK), master:10.0.0.51
[root@db03 ~]# mysql -umha -pmha -h 10.0.0.51 -e "show variables like 'server_id'"
mysql: [Warning] Using a password on the command line interface can be insecure.
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| server_id     | 51    |
+---------------+-------+
[root@db03 ~]# mysql -umha -pmha -h 10.0.0.52 -e "show variables like 'server_id'"
mysql: [Warning] Using a password on the command line interface can be insecure.
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| server_id     | 52    |
+---------------+-------+
[root@db03 ~]# mysql -umha -pmha -h 10.0.0.53 -e "show variables like 'server_id'"
mysql: [Warning] Using a password on the command line interface can be insecure.
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| server_id     | 53    |
+---------------+-------+

2.4.10 故障模拟及处理（后面有故障案例）

### 停主库db01:    
/etc/init.d/mysqld stop

观察manager  日志 tail -f /var/log/mha/app1/manager
末尾必须显示successfully，才算正常切换成功。

修复主库

[root@db01 ~]# /etc/init.d/mysqld start

恢复主从结构

CHANGE MASTER TO 
MASTER_HOST='10.0.0.52',
MASTER_PORT=3306, 
MASTER_AUTO_POSITION=1, 
MASTER_USER='repl', 
MASTER_PASSWORD='123';
start slave ;

修改配置文件

[server1]
hostname=10.0.0.51
port=3306

启动MHA

nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover  < /dev/null> /var/log/mha/app1/manager.log 2>&1 &

2.5 MHA FailOver工作过程

2.5.1 什么是Failover？

故障转移
主库宕机一直到业务恢复正常的处理过程（自动）

2.5.2 Failover 应该需要哪些功能？

(1) 快速监控到主库宕机
(2) 选择新主
(3) 数据补偿
(4) 解除从库身份
(5) 剩余从库和新主库构建主从关系
(6) 应用透明
(7) 故障节点自愈(待开发...)
(8) 故障提醒

2.5.3 主库宕机处理过程(failover)

主库不可用，开始failover操作
MHA启动 ---->发生故障---->(failover开始操作)----恢复
0\. 启动MHA(通过配置文件获取所有节点信息)
    (1) MHA通过masterha_manger脚本启动MHA的功能.
    (2) 在manager启动之前,会自动检查ssh互信(masterha_check_ssh)和主从状态(masterha_check_repl)
1\. 监控节点（主库）
     (1) MHA-manager 通过 masterha_master_monitor脚本(每隔ping_interval秒)
     (2) masterha_master_monitor探测主库3次无心跳之后,就认为主库宕机了.

2\. 选主
算法一
如果设定有权重(candidate_master=1),按照权重强制指定备选主.
    1\. 默认情况下如果一个slave落后master 100M的relay logs的话，即使有权重,也会失效.
    2\. 如果check_repl_delay=0的化,即使落后很多日志,也强制选择其为备选主
算法二
如果判断从库(position或者GTID),数据有差异,最接近于Master的slave,成为备选主
算法三 
如果判断从库(position或者GTID),数据一致,按照配置文件顺序,选主.
3\. 数据补偿
判断主库SSH的连通性
  (1) 当SSH能连接,调用 save_binary_logs脚本，从库对比主库GTID 或者position号,立即将二进制日志保存至各个从节点并且应用
  (2) 当SSH不能连接,调用 apply_diff_relay_logs 脚本,计算从库之间的relaylog的差异,恢复到2号从库
  (3) 第4条会提供额外的数据补偿功能
4\. 二次数据补偿(binlog_server)
5\. 将备选主进行身份切换(解除从库),对外提供服务
    其余从库和新主库确认新的主从关系
6\. 应用透明(VIP)
7\. 故障切换通知(send_reprt)
8\. 自愈自治(待开发...)

2.4.11 Manager额外参数介绍

说明：
主库宕机谁来接管？
1\. 所有从节点日志都是一致的，默认会以配置文件的顺序去选择一个新主。
2\. 从节点日志不一致，自动选择最接近于主库的从库
3\. 如果对于某节点设定了权重（candidate_master=1），权重节点会优先选择。
但是此节点日志量落后主库100M日志的话，也不会被选择。可以配合check_repl_delay=0，关闭日志量的检查，强制选择候选节点。

(1)  ping_interval=1
#设置监控主库，发送ping包的时间间隔，尝试三次没有回应的时候自动进行failover
(2) candidate_master=1
#设置为候选master，如果设置该参数以后，发生主从切换以后将会将此从库提升为主库，即使这个主库不是集群中事件最新的slave
(3)check_repl_delay=0
#默认情况下如果一个slave落后master 100M的relay logs的话，MHA将不会选择该slave作为一个新的master，因为对于这个slave的恢复需要花费很长时间；
#通过设置check_repl_delay=0,MHA触发切换在选择一个新的master的时候将会忽略复制延时，这个参数对于设置了candidate_master=1的主机非常有用，因为加上这个参数候选主在切换的过程中一定是新的master

扩展一下:
candidate_master=1 应用场景?
(1) MHA+KeepAlive VIP(早期MHA架构)
(2) 多地多中心

2.4.12 MHA 的vip功能

参数

master_ip_failover_script=/usr/local/bin/master_ip_failover
注意：/usr/local/bin/master_ip_failover，必须事先准备好
cp master_ip_failover.txt /usr/local/bin/master_ip_failover

修改脚本内容

vi  /usr/local/bin/master_ip_failover
my $vip = '10.0.0.55/24';
my $key = '1';
my $ssh_start_vip = "/sbin/ifconfig eth0:$key $vip";
my $ssh_stop_vip = "/sbin/ifconfig eth0:$key down";

更改manager配置文件：

vi /etc/mha/app1.cnf
添加：
master_ip_failover_script=/usr/local/bin/master_ip_failover
注意：
[root@db03 ~]# dos2unix /usr/local/bin/master_ip_failover 
dos2unix: converting file /usr/local/bin/master_ip_failover to Unix format ...
[root@db03 ~]# chmod +x /usr/local/bin/master_ip_failover

主库上，手工生成第一个vip地址（db01）

手工在主库上绑定vip，注意一定要和配置文件中的ethN一致，我的是eth0:1(1是key指定的值)
ifconfig eth0:1 10.0.0.55/24

重启mha

masterha_stop --conf=/etc/mha/app1.cnf
nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/mha/app1/manager.log 2>&1 &

2.4.13 邮件提醒

1. 参数：
report_script=/usr/local/bin/send
1. 准备邮件脚本
send_report
(1)准备发邮件的脚本(上传 email_2019-最新.zip中的脚本，到/usr/local/bin/中)
     unzip email_2019.zip     
     cp email/* /usr/local/bin/
     chmod +x /usr/local/bin/* 
(2)将准备好的脚本添加到mha配置文件中,让其调用

3. 修改manager配置文件，调用邮件脚本
vi /etc/mha/app1.cnf
report_script=/usr/local/bin/send

（3）停止MHA
masterha_stop --conf=/etc/mha/app1.cnf
（4）开启MHA    
nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/mha/app1/manager.log 2>&1 &

(5) 关闭主库,看警告邮件  
故障修复：
1. 恢复故障节点
（1）实例宕掉
/etc/init.d/mysqld start 
（2）主机损坏，有可能数据也损坏了
备份并恢复故障节点。
2.恢复主从环境
看日志文件：
CHANGE MASTER TO MASTER_HOST='10.0.0.52', MASTER_PORT=3306, MASTER_AUTO_POSITION=1, MASTER_USER='repl', MASTER_PASSWORD='123';
start slave ;
3.恢复manager
3.1 修好的故障节点配置信息，加入到配置文件
[server1]
hostname=10.0.0.51
port=3306
3.2 启动manager   
nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/mha/app1/manager.log 2>&1 &

2.4.14 binlog server（db03）

参数：

binlogserver配置：
找一台额外的机器，必须要有5.6以上的版本，支持gtid并开启，我们直接用的第二个slave（db03）
如果主库宕机，那binlog_server也就无法拉取日志
vim /etc/mha/app1.cnf 
[binlog1]
no_master=1                        不参与选主             
hostname=10.0.0.53                 节点地址
master_binlog_dir=/data/mysql/binlog      补偿binlog日志目录

创建必要目录

mkdir -p /data/mysql/binlog
chown -R mysql.mysql /data/*
修改完成后，将主库binlog拉过来（从000001开始拉，之后的binlog会自动按顺序过来）

拉取主库binlog日志

cd /data/mysql/binlog     -----》必须进入到自己创建好的目录
mysqlbinlog  -R --host=10.0.0.51 --user=mha --password=mha --raw  --stop-never mysql-bin.000001 &
注意：
拉取日志的起点,需要按照目前主库正在使用的binlog为起点

重启MHA

masterha_stop --conf=/etc/mha/app1.cnf
nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/mha/app1/manager.log 2>&1 &

binlog_server会出现延时吗？

binlog_server不会像从库一样出现延时的情况
因为主库commit一个事务，只用等到事务写入到磁盘才算提交成功。
如果有binlog_server那主库提交事务不仅要写入本地的磁盘还要写入远程的磁盘(binlog_sevre)，
不然的话binlog_sevrer会阻塞主库提交事务。

2.6 故障模拟及故障处理

2.5.1 宕掉 db01 数据库

/etc/init.d/mysqld stop

2.5.2 恢复故障

(1) 启动故障节点

[root@db01 ~]# /etc/init.d/mysqld start

(2) 恢复1主2从(db01)

mha日志跟我们提供了从库恢复主从关系的语句
[root@db03 bin]# grep "CHANGE MASTER TO"  /var/log/mha/app1/manager
Thu Jul 18 18:31:54 2019 - [info]  All other slaves should start replication from here. Statement should be: CHANGE MASTER TO MASTER_HOST='10.0.0.52', MASTER_PORT=3306, MASTER_AUTO_POSITION=1, MASTER_USER='repl', MASTER_PASSWORD='xxx';

db01 [(none)]>CHANGE MASTER TO MASTER_HOST='10.0.0.52', MASTER_PORT=3306, MASTER_AUTO_POSITION=1, MASTER_USER='repl', MASTER_PASSWORD='123';
db01 [(none)]>start slave;

(3) 恢复配置文件(db03)

vim /etc/mha/app1.cnf
[server1]
hostname=10.0.0.51
port=3306
[server2]
hostname=10.0.0.52
port=3306
[server3]
hostname=10.0.0.53
port=3306

(4) 启动MHA

[root@db03 bin]# nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover  < /dev/null> /var/log/mha/app1/manager.log 2>&1 &

(5）检查mha状态

masterha_check_status --conf=/etc/mha/app1.cnf
app1 (pid:16543) is running(0:PING_OK), master:10.0.0.52

(6)恢复binlogserver

cd /data/mysql/binlog    
rm -rf /data/mysql/binlog/*
mysqlbinlog  -R --host=10.0.0.52 --user=mha --password=mha --raw  --stop-never mysql-bin.000001 &

3.管理员在高可用架构维护的职责

1\. 搭建：MHA+VIP+SendReport+BinlogServer
2\. 监控及故障处理
3\.  高可用架构的优化
 核心是：尽可能降低主从的延时，让MHA花在数据补偿上的时间尽量减少。
5.7 版本，开启GTID模式，开启从库SQL并发复制。

MySQL-MHA高可用技术
1. 主从复制架构演变介绍 1.1 基本结构 1.2 高级应用架构演变 1.2.1 高性能架构 1.2.2 高可用...
MySQL-MHA高可用技术
主从复制架构演变介绍基本结构 MHA简介： MHA工作原理：高级应用架构演变高可用架构介绍高可用MHA *...
MySQL-MHA高可用技术
MHA具体的搭建环境如下: 角色 IP地址 ...
今日份打卡220/365
技术文章elasticsearch如何做到高可用
今日份打卡220/365
技术文章elasticsearch如何做到高可用
聊聊服务的高可用
写一篇小短文，总结一下服务高可用的常见方案和技术。 1. 什么是高可用 “高可用性”（High Availabil...
redis主从+keepalived实现高可用技术（转）
redis主从+keepalived实现高可用技术keepalive+redis 主从高可用 Redis是我们当下...
《亿级流量网站架构核心技术》
读书总结读书总结可以看着两篇文章高可用系统技术梳理高并发系统技术梳理
Keepalived实现高可用技术
一. 主配置文件详解：/etc/keepalived/keepalived.conf ! Configuratio...
高可用系统技术梳理
负载均衡隔离方案限流高可用系统处理方式-限流降级回滚机制超时与重试压测与预案

MySQL-MHA高可用技术

1. 主从复制架构演变介绍

1.1 基本结构

1.2 高级应用架构演变

1.2.1 高性能架构

1.2.2 高可用架构

2. 高可用MHA *****

2.1 MHA介绍

2.2 架构介绍:

2.3 MHA软件构成（perl语言）

2.4 MHA环境搭建

2.4.1 规划:

2.4.2 准备环境（略。1主2从GTID）

2.4.3 配置关键程序软连接

2.4.4 配置各节点互信

2.4.5 安装软件

下载mha软件

所有节点安装Node软件依赖包

在db01主库中创建mha需要的用户

Manager软件安装（db03）

2.4.6 配置文件准备(db03)

2.4.7 状态检查

状态检查（db03）

2.4.8 开启MHA(db03)：

2.4.9 查看MHA状态

2.4.10 故障模拟及处理（后面有故障案例）

修复主库

恢复主从结构

修改配置文件

启动MHA

2.5 MHA FailOver工作过程

2.5.1 什么是Failover？

2.5.2 Failover 应该需要哪些功能？

2.5.3 主库宕机处理过程(failover)

2.4.11 Manager额外参数介绍

2.4.12 MHA 的vip功能

参数

修改脚本内容

更改manager配置文件：

主库上，手工生成第一个vip地址（db01）

重启mha

2.4.13 邮件提醒

2.4.14 binlog server（db03）

参数：

创建必要目录

拉取主库binlog日志

重启MHA

binlog_server会出现延时吗？

2.6 故障模拟及故障处理

2.5.1 宕掉 db01 数据库

2.5.2 恢复故障

(1) 启动故障节点

(2) 恢复1主2从(db01)

(3) 恢复配置文件(db03)

(4) 启动MHA

(5）检查mha状态

(6)恢复binlogserver

3.管理员在高可用架构维护的职责

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读