美文网首页
3.3sqoop保存最后导入的数据

3.3sqoop保存最后导入的数据

作者: NEO_X | 来源:发表于2019-06-02 22:37 被阅读0次

Apache Sqoop Cookbook 英文版-翻译学习!!
更多信息https://blue-shadow.top/

3.3保存最后导入的数据

问题

增量导入是一个很好的功能, 可以多多使用。但是记住最后一次导入的值是很困难的。

解决方案

可以利用Sqoop的内部的元数据进行存储最近使用的参数,可以通过创建一个简单的增量导入作业来使用这个功能:

sqoop job \
    --create visits \
    --import \
    --connect jdbc:mysql://mysql.example.com/sqoop \
    --username sqoop \
    --password sqoop \
    --table visits \
    --incremental append \
    --check-column id \
    --last-value 0

运行这个作业的命令 --exec 参数 , 即这样: sqoop job --exec visits

讨论

Sqoop元数据是Sqoop强大的一部分,其可以允许你保存作业的定义,并且轻松的调用。每个被保存的作业都有一个可以被引用的的逻辑名称。
可以使用参数 --list 获取所有作业的列表。

sqoop job --list

通过参数 --delete 删除不在需要的老的作业定义,如以下示例:

sqoop job --delete visitis 

最后,通过参数 --show parameter 来查看已经保存的的作业内容,参数 sqoop job --show visits 用于将作业以参数的形式展现。
不幸的是, Sqoop当前无法重建用于创建已保存作业的命令行,内置 Sqoop metastore 最重要的好处是结合增量导入。Sqoop 将自动将上次导入的值序列化为
metastore 在每个成功的增量工作之后。这样用户就不需要记住每次执行后的最后一个导入值一切都处理自动处理。

相关文章

  • 3.3sqoop保存最后导入的数据

    Apache Sqoop Cookbook 英文版-翻译学习!!更多信息https://blue-shadow.t...

  • matlab数学建模基础

    1.数据的导入和保存 1.1数据的导入 matlab中导入数据的函数通常为load matlab中常用的导入数据的...

  • Gephi 初次使用问题总结

    csv文件导入问题笔者是通过python保存的csv文件导入数据,导入时,在导入边数据时会提示‘需要源和目标的编号...

  • R学习笔记_02_I/O操作

    摘要:数据的导入和输出(I/O);脚本文件的导入以及运行结果的保存;R包的安装和载入。 数据导入 键盘输入edit...

  • Rdata001 数据处理包tidyverse

    1.数据处理 1.1 数据导入 将数据导入R。这实际上就是读取保存在文件、数据库或Web API 中的数据,再加载...

  • SPSS数据的导入与保存

    本文数据可以通过以下链接获取:链接:https://pan.baidu.com/s/1zNM6yINkA5QSPv...

  • R包

    1.数据导入 以下R包主要用于数据导入和保存数据: feather:一种快速,轻量级的文件格式;在R和python...

  • 重装mongodb ,使用原数据库文件恢复

    把重装之前保存下来的数据目录导入到新安装的数据库里面

  • SparkML 实现 ALS 算法

    引入依赖 数据准备 门店数据 通过 dml.sql 导入了 400 条数据; 行为数据 保存在文件 behavio...

  • 【硬派网络计费系统】- 用户资料批量导入

    该功能主要用来实现用户资料的批量导入,按照导入模板格式编辑,最后保存为 csv 格式的文本文件,注意保存字符集设置...

网友评论

      本文标题:3.3sqoop保存最后导入的数据

      本文链接:https://www.haomeiwen.com/subject/wcnwtctx.html