美文网首页大数据
HDFS文件系统数据备份

HDFS文件系统数据备份

作者: 明明德撩码 | 来源:发表于2018-02-26 17:51 被阅读34次

HDFS快照是一个只读的基于时间点文件系统拷贝。快照可以是整个文件系统的 也可以是一部分。常用来作为数据备份,防止用户错误和容灾快照功能。

HDFS实现功能:

  • Snapshot 创建的时间 复杂度为O(1),但是不包括INode 的寻找时间
  • 只有当修改SnapShot时,才会有额外的内存占用,内存使用量为O(M),M 为修改的文件 或者目录数
  • 在DataNode上面的blocks 不会复制,做Snapshot 的文件是纪录了block的列表和文件的 大小,但是没有数据的复制
  • Snapshot 并不会影响HDFS 的正常操作:修改会按照时间的反序记录,这样可以直接读 取到最新的数据。快照数据是当前数据减去修改的部分计算出来的。

快照命令

  • 设置一个目录为可快照
    $ bin/hdfs dfsadmin -allowSnapshot <path>
  • 取消目录可快照
    $ bin/hdfs dfsadmin -disallowSnapshot <path>
  • 生成快照
    $ bin/hdfs dfs -createSnapshot <path> [<snapshotName>]
  • 删除快照
    $ bin/hdfs dfs -deleteSnapshot <path> <snapshotName>
  • 列出所有可快照目录
    $ bin/hdfs lsSnapshottableDir
  • 比较快照之间的差异
    $ bin/hdfs snapshotDiff <path> <fromSnapshot> <toSnapshot>

具体例子看光官网

相关文章

  • 大数据

    HDFS 分布式文件系统 按块存储支持大规模文件存储简化系统设计数据备份 名称节点,整个HDFS集群的管家。FsI...

  • HDFS文件系统数据备份

    HDFS快照是一个只读的基于时间点文件系统拷贝。快照可以是整个文件系统的 也可以是一部分。常用来作为数据备份,防止...

  • 1、Hadoop概要

    一、HDFS Hadoop中的分布式文件系统,高容错(数据库blcok备份),可扩展,适合存储大文件,不适合存储小...

  • Hadoop Start(3) ——HDFS原理: HDFS H

    HDFS HA简介在完全分布式HDFS集群中,即使通过namenode备份还是无法做到及时的文件系统高可用,nam...

  • 创建hive表,快速添加测试数据,通过加载hdfs数据

    上传数据到hdfs文件系统 创建hdfs文件系统文件夹 导入本地的文件到hdfs 查看刚才创建的test文件夹是否...

  • 105_es生产集群备份恢复之基于snapshot+hdfs进行

    105_es生产集群备份恢复之基于snapshot+hdfs进行数据备份 1、es集群数据备份 任何一个存储数据的...

  • 三十五、ElasticsearchI基于snapshot+ Ha

    一、es生产集群备份恢复之基于snapshot+hdfs进行数据备份1、es集群数据备份 任何一个存储数据的软件,...

  • NiFi 实战

    Demo 1 local to HDFS 1 场景: 文件批量上传HDFS 2 数据源 local文件系统中, /...

  • HDFS 数据块管理

    Namenode 维护着 HDFS 中两个重要的关系: HDFS 文件系统和目录树 数据块和数据节点的对应关系,即...

  • MySQL 备份及原理

    冷备份 服务停机进行数据文件拷贝进行备份。 逻辑备份 相关概念: 快照:快照备份是指通过文件系统...

网友评论

    本文标题:HDFS文件系统数据备份

    本文链接:https://www.haomeiwen.com/subject/uxnyxftx.html