美文网首页
数据迁移

数据迁移

作者: 星丶雲 | 来源:发表于2019-10-29 15:20 被阅读0次

如何平滑地迁移数据库中的数据

你可能会认为:数据迁移无非是将数据从一个数据库拷贝到另一个数据库,可以通过 MySQL 主从同步的方式做到准实时的数据拷贝;也可以通过 mysqldump 工具将源库的数据导出,再导入到新库,这有什么复杂的呢?

  • 其实,这两种方式只能支持单库到单库的迁移,无法支持单库到多库多表的场景。而且即便是单库到单库的迁移,迁移过程也需要满足以下几个目标:
  • 迁移应该是在线的迁移,也就是在迁移的同时还会有数据的写入;
    数据应该保证完整性,也就是说在迁移之后需要保证新的库和旧的库的数据是一致的;
  • 迁移的过程需要做到可以回滚,这样一旦迁移的过程中出现问题,可以立刻回滚到源库,不会对系统的可用性造成影响。
  • 如果你使用 Binlog 同步的方式,在同步完成后再修改代码,将主库修改为新的数据库,这样就不满足可回滚的要求,一旦迁移后发现问题,由于已经有增量的数据写入了新库而没有写入旧库,不可能再将数据库改成旧库。

一般来说,我们有两种方案可以做数据库的迁移。

  • “双写”方案
    第一种方案我称之为双写,其实说起来也很简单,它可以分为以下几个步骤:
  1. 将新的库配置为源库的从库,用来同步数据;如果需要将数据同步到多库多表,那么可以使用一些第三方工具获取 Binlog 的增量日志(比如开源工具 Canal),在获取增量日志之后就可以按照分库分表的逻辑写入到新的库表中了。
  2. 同时,我们需要改造业务代码,在数据写入的时候,不仅要写入旧库,也要写入新库。当然,基于性能的考虑,我们可以异步地写入新库,只要保证旧库写入成功即可。但是,我们需要注意的是,需要将写入新库失败的数据记录在单独的日志中,这样方便后续对这些数据补写,保证新库和旧库的数据一致性。
  3. 然后,我们就可以开始校验数据了。由于数据库中数据量很大,做全量的数据校验不太现实。你可以抽取部分数据,具体数据量依据总体数据量而定,只要保证这些数据是一致的就可以。
  4. 如果一切顺利,我们就可以将读流量切换到新库了。由于担心一次切换全量读流量可能会对系统产生未知的影响,所以这里最好采用灰度的方式来切换,比如开始切换 10% 的流量,如果没有问题再切换到 50% 的流量,最后再切换到 100%。
  5. 由于有双写的存在,所以在切换的过程中出现任何的问题,都可以将读写流量随时切换到旧库去,保障系统的性能。
  6. 在观察了几天发现数据的迁移没有问题之后,就可以将数据库的双写改造成只写新库,数据的迁移也就完成了。
image.png
  • 级联同步方案
    这种方案也比较简单,比较适合数据从自建机房向云上迁移的场景。因为迁移上云,最担心云上的环境和自建机房的环境不一致,会导致数据库在云上运行时,因为参数配置或者硬件环境不同出现问题。
    所以,我们会在自建机房准备一个备库,在云上环境上准备一个新库,通过级联同步的方式在自建机房留下一个可回滚的数据库,具体的步骤如下:
  1. 先将新库配置为旧库的从库,用作数据同步;
  2. 再将一个备库配置为新库的从库,用作数据的备份;
  3. 等到三个库的写入一致后,将数据库的读流量切换到新库;
  4. 然后暂停应用的写入,将业务的写入流量切换到新库(由于这里需要暂停应用的写入,所以需要安排在业务的低峰期)。
image.png

相关文章

  • MySQL数据库- 几种数据迁移的方法详解都在这了!看完必懂

    数据迁移的几种方式 - MySQL数据库 本文关键字:MySQL、数据库、数据迁移、导入、导出 文章目录 数据迁移...

  • hive数据迁移

    hive的数据迁移一般需要考虑多个部分。1.元数据怎么迁移2.数据怎么迁移3.迁移过后元数据和数据怎么产生关联 1...

  • THINKPHP5 的数据迁移工具

    THINKPHP5 的数据迁移工具 migration 数据迁移的主要作用 数据迁移就像是数据库的版本控制,可以避...

  • THINKPHP5 的数据迁移工具

    THINKPHP5 的数据迁移工具 migration 数据迁移的主要作用 数据迁移就像是数据库的版本控制,可以避...

  • oracle数据库迁移

    背景:需要将数据库迁移到另外一台实例上,全量迁移数据库实例,但是只迁移表结构,数据不需要迁移,具体迁移过程如下。 ...

  • 一篇文章教你自建hadoop集群迁移到EMR

    自建集群要迁移到EMR集群,往往需要迁移已有数据。本文主要介绍hdfs数据和hive meta数据如何迁移。 前置...

  • hdfs文件迁移

    hadoop跨集群之间迁移HDFS数据 不同hadoop集群之间迁移hive数据 hadoop跨集群之间迁移hiv...

  • 从零开始学SpringBoot之数据库迁移:概述

    前言: 在这里的数据库迁移主要是对数据库结构版本管理和迁移。 一、为什么需要数据库迁移工具? 那在没有使用迁移工具...

  • Tair数据迁移三步走

    迁移的三个阶段 在多机房数据迁移中,整个过程分为三个阶段:历史数据迁移阶段、redolog迁移阶段、实时复制阶段。...

  • windows服务器迁移linux服务器

    一、数据库数据迁移(迁移到云数据库rds上) 使用阿里云的数据传输服务DTS(增量迁移源数据库必须开启二进制日志,...

网友评论

      本文标题:数据迁移

      本文链接:https://www.haomeiwen.com/subject/bjzwvctx.html