美文网首页
binlog2sql UnicodeDecodeError: '

binlog2sql UnicodeDecodeError: '

作者: 月饮沙 | 来源:发表于2020-10-15 17:02 被阅读0次

    问题场景

    最近在使用binlog2sql进行MySQL数据库误操作恢复的时候,遇到了一个错误:
    UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 0: invalid start byte

    原因

    通过检查源码和测试发现,这个问题是由于源代码中,在生成回滚语句时,首先将回滚语句保存到临时文件中,然后按照block读取临时文件,倒序输出语句。
    最后生成的回滚语句和原始的执行顺序是相反的,即后执行的语句先回滚。
    在Python3环境中,需要使用utf-8对文件内容进行解码,在解码时,如果一个block的内容是以b开头的,就会出现解码失败报错的情况。

    处理方案

    要修复这个问题,可以更新代码的以下部分
    也可以直接下载更新后的代码 binlog2sql

        def print_rollback_sql(self, filename):
            """print rollback sql from tmp_file"""
            # 首先尝试原始方法
            try:
                with open(filename, "rb") as f_tmp:
                    batch_size = 1000
                    i = 0
                    for line in reversed_lines(f_tmp):
                        print(line.rstrip())
                        if i >= batch_size:
                            i = 0
                            if self.back_interval:
                                print('SELECT SLEEP(%s);' % self.back_interval)
                        else:
                            i += 1
            # 如果使用原始方法遇到问题,读取整个文件进行倒序输出
            # 占用内存可能上升
            except:
                with open(filename, "rb") as f_tmp:
                    s = f_tmp.read()
                    if sys.version > '3':
                        s_decode = s.decode("utf-8")
                s_list = s_decode.split("\n")
                s_list.reverse()
                batch_size = 1000
                i = 0
                for line in s_list:
                    print(line.rstrip())
                    if i >= batch_size:
                        i = 0
                        if self.back_interval:
                            print('SELECT SLEEP(%s);' % self.back_interval)
                        else:
                            i += 1
    

    binlog2sql 说明

    从MySQL binlog解析出你要的SQL。根据不同选项,你可以得到原始SQL、回滚SQL、去除主键的INSERT SQL等。

    用途

    • 数据快速回滚(闪回)
    • 主从切换后新master丢数据的修复
    • 从binlog生成标准SQL,带来的衍生功能

    环境

    * Python 2.7, 3.4+
    * MySQL 5.6, 5.7
    

    安装

    shell> git clone https://github.com/danfengcao/binlog2sql.git && cd binlog2sql
    shell> pip install -r requirements.txt
    

    使用

    MySQL server必须设置以下参数:

    [mysqld]
    server_id = 1
    log_bin = /var/log/mysql/mysql-bin.log
    max_binlog_size = 1G
    binlog_format = row
    binlog_row_image = full
    

    user需要的最小权限集合:

    select, super/replication client, replication slave
    
    建议授权
    GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 
    

    权限说明

    • select:需要读取server端information_schema.COLUMNS表,获取表结构的元信息,拼接成可视化的sql语句
    • super/replication client:两个权限都可以,需要执行'SHOW MASTER STATUS', 获取server端的binlog列表
    • replication slave:通过BINLOG_DUMP协议获取binlog内容的权限

    基本用法

    解析出标准SQL

    shell> python binlog2sql.py -h127.0.0.1 -P3306 -uadmin -p'admin' -dtest -t test3 test4 --start-file='mysql-bin.000002'
    
    输出:
    INSERT INTO `test`.`test3`(`addtime`, `data`, `id`) VALUES ('2016-12-10 13:03:38', 'english', 4); #start 570 end 736
    UPDATE `test`.`test3` SET `addtime`='2016-12-10 12:00:00', `data`='中文', `id`=3 WHERE `addtime`='2016-12-10 13:03:22' AND `data`='中文' AND `id`=3 LIMIT 1; #start 763 end 954
    DELETE FROM `test`.`test3` WHERE `addtime`='2016-12-10 13:03:38' AND `data`='english' AND `id`=4 LIMIT 1; #start 981 end 1147
    

    解析出回滚SQL

    
    shell> python binlog2sql.py --flashback -h127.0.0.1 -P3306 -uadmin -p'admin' -dtest -ttest3 --start-file='mysql-bin.000002' --start-position=763 --stop-position=1147
    
    输出:
    INSERT INTO `test`.`test3`(`addtime`, `data`, `id`) VALUES ('2016-12-10 13:03:38', 'english', 4); #start 981 end 1147
    UPDATE `test`.`test3` SET `addtime`='2016-12-10 13:03:22', `data`='中文', `id`=3 WHERE `addtime`='2016-12-10 12:00:00' AND `data`='中文' AND `id`=3 LIMIT 1; #start 763 end 954
    

    选项

    mysql连接配置

    -h host; -P port; -u user; -p password

    解析模式

    --stop-never 持续解析binlog。可选。默认False,同步至执行命令时最新的binlog位置。

    -K, --no-primary-key 对INSERT语句去除主键。可选。默认False

    -B, --flashback 生成回滚SQL,可解析大文件,不受内存限制。可选。默认False。与stop-never或no-primary-key不能同时添加。

    --back-interval -B模式下,每打印一千行回滚SQL,加一句SLEEP多少秒,如不想加SLEEP,请设为0。可选。默认1.0。

    解析范围控制

    --start-file 起始解析文件,只需文件名,无需全路径 。必须。

    --start-position/--start-pos 起始解析位置。可选。默认为start-file的起始位置。

    --stop-file/--end-file 终止解析文件。可选。默认为start-file同一个文件。若解析模式为stop-never,此选项失效。

    --stop-position/--end-pos 终止解析位置。可选。默认为stop-file的最末位置;若解析模式为stop-never,此选项失效。

    --start-datetime 起始解析时间,格式'%Y-%m-%d %H:%M:%S'。可选。默认不过滤。

    --stop-datetime 终止解析时间,格式'%Y-%m-%d %H:%M:%S'。可选。默认不过滤。

    对象过滤

    -d, --databases 只解析目标db的sql,多个库用空格隔开,如-d db1 db2。可选。默认为空。

    -t, --tables 只解析目标table的sql,多张表用空格隔开,如-t tbl1 tbl2。可选。默认为空。

    --only-dml 只解析dml,忽略ddl。可选。默认False。

    --sql-type 只解析指定类型,支持INSERT, UPDATE, DELETE。多个类型用空格隔开,如--sql-type INSERT DELETE。可选。默认为增删改都解析。用了此参数但没填任何类型,则三者都不解析。

    --trans-number 解析的事务数量,可选。默认无限制 这个是我个人修改后代码中的功能,源代码是没有的

    参考链接

    源码地址

    相关文章

      网友评论

          本文标题:binlog2sql UnicodeDecodeError: '

          本文链接:https://www.haomeiwen.com/subject/rwlopktx.html