美文网首页
再也不怕数据丢失!阿里云RDS MySQL 8.0上线回收站功能

再也不怕数据丢失!阿里云RDS MySQL 8.0上线回收站功能

作者: 暖忆_ | 来源:发表于2019-08-16 15:57 被阅读0次

RDS MySQL 8.0 Recycle Bin

背景

MySQL 在生产环境使用过程中,会伴随着开发和运维人员的误操作,比如 DROP TABLE / DATABASE,这类 DDL 语句不具有可操作的回滚特性,而导致数据丢失,AliSQL 8.0 新特性支持回收站功能(Recycle Bin),临时把删除清理的表转移到回收站,并保留可设置的时间,方便用户找回数据。为了方便,提供了 DBMS_RECYCLE package 作为管理接口。

Recycle Bin 管理接口

Recycle Bin 提供了两个管理接口,分别是:

DBMS_RECYCLE.show_tables()

展示回收站中所有临时保存的表:

mysql> call dbms_recycle.show_tables();+-----------------+---------------+---------------+--------------+---------------------+---------------------+| SCHEMA          | TABLE        | ORIGIN_SCHEMA | ORIGIN_TABLE | RECYCLED_TIME      | PURGE_TIME          |+-----------------+---------------+---------------+--------------+---------------------+---------------------+| __recycle_bin__ | __innodb_1063 | product_db    | t1          |2019-08-0811:01:46|2019-08-1511:01:46|| __recycle_bin__ | __innodb_1064 | product_db    | t2          |2019-08-0811:01:46|2019-08-1511:01:46|| __recycle_bin__ | __innodb_1065 | product_db    | parent      |2019-08-0811:01:46|2019-08-1511:01:46|| __recycle_bin__ | __innodb_1066 | product_db    | child        |2019-08-0811:01:46|2019-08-1511:01:46|+-----------------+---------------+---------------+--------------+---------------------+---------------------+4rowsinset (0.00sec)

-- Columns 解释:

SCHEMA 

回收站的 schema

TABLE 

进入回收站后的表名

ORIGIN_SCHEMA 

原始表的 schema

ORIGIN_TABLE 

原始表的表名

RECYCLED_TIME 

回收时间

PURGE_TIME 

未来被清理掉的时间

1,

DBMS_RECYCLE.purge_table(table_name=>)

手动清理回收站中的某张表

mysql> call dbms_recycle.purge_table("__innodb_1063");Query OK,0rows affected (0.01sec)清理掉回收站中的"__innodb_1063"表

Recycle Bin 参数

Recycle Bin 一共设计了 5 个参数,分别是:

1,recycle_bin

recycle_bin

-- 是否打开回收功能, session + global 级别。

2,recycle_bin_retention

recycle_bin_retention

    -- 回收站保留最长时间是多少,单位是seconds,默认是一周。

3,recycle_scheduler

recycle_scheduler

    -- 是否打开回收站的异步清理任务线程

4,recycle_scheduler_interval

recycle_scheduler_interval    -- 回收站异步清理线程的轮询间隔,单位是seconds, 默认是30s。

5,recycle_scheduler_purge_table_print

recycle_scheduler_purge_table_print

    -- 是否打印异步清理现场工作的详细日志

Recycle Bin 设计

Recycle Bin 总览

1. 回收机制

当操作 DROP TABLE / DATABASE 语句的时候, 只保留相关的表对象,并移动到专门的 recycle bin 目录中,

其它对象的删除策略是:

与表无关的对象,比如 procedure,根据操作语句决定是否保留,不做回收。

表的附属对象,比如 trigger,Foreign key,column statistics等,只要存在可能修改表数据的,做删除,

比如 trigger,Foreign key。 但columns statistics不做清理,随表进入回收站。

2. 清理机制

回收站会启动一个background 线程,来异步清理超过 recycle_bin_retention 时间的表对象, 在清理回收站表的时候,如果遇到是大表的清理,会再启动一个background 来做异步大文件删除。

Recycle schema 和权限控制

1. recycle schema 

MySQL 系统启动的时候,会初始化一个 recycle bin 的schema, 命名为 "__recycle_bin__", 作为回收站使用的专有 database。

mysql> show databases;+--------------------+| Database          |+--------------------+| __recycle_bin__    || information_schema || mysql              || performance_schema || sys                |+--------------------+6rowsinset (0.00sec)

2. 权限控制

Database 权限:

recycle_bin 作为回收站的 schema,是系统级 database,没有权限做修改和删除。

用户无法使用drop table / database 来操作回收站。

比如:

mysql> drop table __recycle_bin__.__innodb_1064;ERROR1044(42000): Access deniedforuser'b1'@'%'to database'__recycle_bin__'

recycled table 权限:

-- recycle scheduler 后台线程具有所有权限,可以做清理工作;

-- 用户虽然无法直接 drop table,可以使用 dbms_recycle.purge_table(),

但仍然需要原表和回收站表都具有 DROP_ACL 权限:

比如:

mysql> call dbms_recycle.purge_table("__innodb_1064");ERROR1142(42000): DROP command denied to user'b1'@'localhost'fortable'__innodb_1064'-- Grant 回收站权限mysql> grant drop on __recycle_bin__.__innodb_1064 to b1@'%';Query OK,0rows affected (0.00sec)-- Grant 原表权限mysql> grant drop on product_db.t2 to b1@'%';Query OK,0rows affected (0.00sec)mysql> call dbms_recycle.purge_table("__innodb_1064");Query OK,0rows affected (0.01sec)

Recycled table 命名规则

Recycled table 会从不同的 schema,回收到统一的 recycle bin 回收站中,所以需要保证目标表表名唯一,所以

这里定义了一个命名格式:

"__"+ Storge Engine + SE private id

Storge Engine:代表存储引擎名称,比如 innodb。

SE private id:是存储引擎为每一个表生成的唯一值,比如 InnoDB 中,就是 table id,

以此来唯一表示一个表名称。

Recycled table 关联对象

在回收表的过程中,需要处理表的相关对象,其处理的原则是:

如果是表附属对象,可能会存在修改表数据的可能性,就做删除,比如 trigger 和 FK。

如果是表相关对象,不会修改数据,就不做清理,比如相关的 view,统计信息等。

下面通过一个例子来看下:

原始结构

CREATE TABLE parent (    id INT NOT NULL,    PRIMARY KEY (id)) ENGINE=INNODB;CREATE TABLE child (    id INT,    parent_id INT,    self_id INT,    INDEX id_ind (id),    INDEX par_ind (parent_id),    INDEX sel_ind (self_id),    FOREIGN KEY (self_id) REFERENCES child(id),    FOREIGN KEY (parent_id) REFERENCES parent(id) ON DELETE CASCADE) ENGINE=INNODB;CREATE TABLE log(id INT);delimiter//CREATE TRIGGER trigger_child  before INSERT ON child FOR EACH ROWBEGIN  INSERT INTO log value(1);END//delimiter ;CREATE VIEW view_child AS SELECT * FROM child;

Drop 并回收(相关关联对象删除或失效)

1.删除表 child;mysql> drop table child;Query OK,0rows affected (0.01sec)2.查看回收站,及 child 表在回收站的结构mysql> call dbms_recycle.show_tables();+-----------------+---------------+---------------+--------------+---------------------+---------------------+| SCHEMA          | TABLE        | ORIGIN_SCHEMA | ORIGIN_TABLE | RECYCLED_TIME      | PURGE_TIME          |+-----------------+---------------+---------------+--------------+---------------------+---------------------+| __recycle_bin__ | __innodb_1068 | test          | child        |2019-08-0812:32:48|2019-08-1512:32:48|+-----------------+---------------+---------------+--------------+---------------------+---------------------+mysql> show create table __recycle_bin__.__innodb_1068\G***************************1.row ***************************      Table: __innodb_1068Create Table: CREATE TABLE`__innodb_1068`(`id`int(11) DEFAULT NULL,`parent_id`int(11) DEFAULT NULL,`self_id`int(11) DEFAULT NULL,  KEY`id_ind`(`id`),  KEY`par_ind`(`parent_id`),  KEY`sel_ind`(`self_id`)) ENGINE=InnoDB DEFAULT CHARSET=utf8-- 相关的 Foreign key 已经全部删除。3.查看相关trigger。mysql> show create trigger trigger_child;ERROR1360(HY000): Trigger does not exist-- 相关的trigger已经全部删除。4.查看相关view。mysql> show create view view_child\G***************************1.row ***************************                View: view_child        Create View: CREATE ALGORITHM=UNDEFINED DEFINER=`root`@`localhost`SQL SECURITY DEFINER VIEW`view_child`AS select`child`.`id`AS`id`,`child`.`parent_id`AS`parent_id`,`child`.`self_id`AS`self_id`from`child`character_set_client: utf8mb4collation_connection: utf8mb4_0900_ai_ci1rowinset,1warning (0.01sec)mysql> show warnings;+---------+------+-----------------------------------------------------------------------------------------------------------------------------------+| Level  | Code | Message                                                                                                                          |+---------+------+-----------------------------------------------------------------------------------------------------------------------------------+| Warning |1356| View'test.view_child'references invalid table(s) or column(s) orfunction(s)ordefiner/invokerofviewlackrightstousethem|+---------+------+-----------------------------------------------------------------------------------------------------------------------------------+1rowinset(0.00 sec)-- 相关的view已经失效。

Master-slave 独立回收

在 master - slave 结构中, 是否回收,或回收站保留的周期,都是实例本身的设置,不会影响到 binlog 复制到的节点上,所以,我们可以在 master 节点上设置回收,保留 7 天周期,在slave 节点上,设置回收,保留14天周期。

比如

master:

--recycle_bin = on--recycle_bin_retention =7*24*60*60master节点上,回收站保留7天

slave:

--recycle_bin = on--recycle_bin_retention =14*24*60*60slave 节点上,回收站保留14天

要注意的点就是,回收站保留周期不同,将导致 master - slave 节点之间的空间占用差别比较大。

异步表清理和大文件删除

当 recycle scheduler 异步线程 purge 回收站的表时候,如果遇到大表,那么将会启动大表异步删除逻辑,相关参数如下:

INNODB_DATA_FILE_PURGE: Whether enable theasyncpurge strategyINNODB_DATA_FILE_PURGE_IMMEDIATE: Unlink data file rather than truncateINNODB_DATA_FILE_PURGE_ALL_AT_SHUTDOWN: Cleanup all when normal shutdownINNODB_DATA_FILE_PURGE_DIR: Temporary file directoryINNODB_DATA_FILE_PURGE_INTERVAL: Purge time interval (by milliseconds)INNODB_DATA_FILE_PURGE_MAX_SIZE: Purge max size every time (by MB)INNODB_PRINT_DATA_FILE_PURGE_PROCESS: Print the processoffile purge worker

比如设置:

set global INNODB_DATA_FILE_PURGE = on;set global INNODB_DATA_FILE_PURGE_INTERVAL =100;set global INNODB_DATA_FILE_PURGE_MAX_SIZE =128;每100ms,删除128MB 大小。

可以通过如下视图,查看大表异步删除的进展情况:

mysql> select *frominformation_schema.innodb_purge_files;  +--------+---------------------+--------------------------------------+---------------+------------------------+--------------+  | log_id | start_time          |          original_path              | original_size | temporary_path        | current_size |  +--------+---------------------+--------------------------------------+---------------+------------------------+--------------+  |36|2019-08-0812:06:38| ./__recycle_bin__/__innodb_1064.ibd  |37748736| purge/#FP_1557846107_1 |20971520|  +--------+---------------------+--------------------------------------+---------------+------------------------+--------------+

注意事项

1,回收站跨文件系统

如果你的回收站目录 "__recycle__bin_"_ 和回收的表跨了文件系统,那么drop table,将会搬迁表空间文件,耗时较长。

2,General tablespace

general tablespace 会存在多个表共享同一个表空间的情况, 当回收其中一张表的时候,不会搬迁相关的表空间文件,如果master 和 slave 设置的回收保留时间不同,那么就会存在在某一个时间点,主备间的这个general tablespace中的表数量不相等的情况。

相关文章

网友评论

      本文标题:再也不怕数据丢失!阿里云RDS MySQL 8.0上线回收站功能

      本文链接:https://www.haomeiwen.com/subject/jdhqsctx.html