美文网首页
sqoop导入导出常见问题

sqoop导入导出常见问题

作者: bigdata张凯翔 | 来源:发表于2020-06-11 23:22 被阅读0次
踩玻璃栈道.png

呀,不好意思,附错图啦,哈哈哈哈!

言归正传!

sqoop的使用.png

Sqoop数据导出Parquet

Ads层数据用Sqoop往MySql中导入数据的时候,如果用了orc(Parquet)不能导入,需转化成text格式

Sqoop数据导出控制

Sqoop中导入导出Null存储一致性问题:
Hive中的Null在底层是以“\N”来存储,而MySQL中的Null在底层就是Null,为了保证数据两端的一致性。在导出数据时采用--input-null-string和--input-null-non-string两个参数。导入数据时采用--null-string和--null-non-string。

Sqoop数据导出一致性问题

当Sqoop导出数据到MySql时,使用4个map怎么保证数据的一致性
因为在导出数据的过程中map任务可能会失败,可以使用—staging-table –clear-staging

sqoop export --connect jdbc:mysql://192.168.137.10:3306/user_behavior --username 

root --password 123456 --table app_cource_study_report --columns 

watch_video_cnt,complete_video_cnt,dt --fields-terminated-by "\t" --export-dir "/

user/hive/warehouse/tmp.db/app_cource_study_analysis_${day}" --staging-table 

app_cource_study_report_tmp --clear-staging-table --input-null-string '\N'

任务执行成功首先在tmp临时表中,然后将tmp表中的数据复制到目标表中(这个时候可以使用事务,保证事务的一致性)

Tez引擎优点?

Tez可以将多个有依赖的作业转换为一个作业,这样只需写一次HDFS,且中间节点较少,从而大大提升作业的计算性能。
项目经验之元数据备份
元数据备份(重点,如数据损坏,可能整个集群无法运行,至少要保证每日零点之后备份到其它服务器两个复本)

相关文章

  • 137.如何进行离线计算-3

    137.1 数据导出 Sqoop可以对HDFS文件进行导入导出到关系型数据库 Sqoop 工作机制是将导入或导出命...

  • sqoop导入导出常见问题

    呀,不好意思,附错图啦,哈哈哈哈! 言归正传! Sqoop数据导出Parquet Ads层数据用Sqoop往MyS...

  • sqoop import使用

    一、sqoop作用? sqoop是一个数据交换工具,最常用的两个工具是导入导出。 导入导出的参照物是hadoop,...

  • 51cto赵强HADOOP学习(十五)sqoop的导入导出

    使用sqoop导入关系型数据库中的数据 安装 导入导出

  • sqoop数据导入导出应用案例

    sqoop数据导入导出应用案例 1 sqoop导入数据 将RDBMS中的一个表数据导入到hdfs。表中的每一行被视...

  • 大数据开源技术

    从数据库导入 目前比较常用的数据库导入工具有Sqoop和Canal。Sqoop是一个数据库批量导入导出工具,可以将...

  • sqoop导出时拒绝链接

    使用sqoop导入导出时总是拒绝连接。 排查问题,发现每次启动sqoop脚本进行工作时,MySQL服务会自动关闭。...

  • Sqoop数据导入/导出

    1. 从HDFS导出到RDBMS数据库 1.1 准备工作 写一个文件 上传到hdfs:hadoop fs -put...

  • sqoop导入与导出

    1. 导入实例 1.1 登陆数据库查看表 xiaosi@Qunar:~$ mysql -u root -p Ent...

  • Sqoop的导入导出

    sqoop的功能架构 sqoop是能够在hdfs和关系型数据库之间进行数据量大的数据转换工具,底层运行的是mapr...

网友评论

      本文标题:sqoop导入导出常见问题

      本文链接:https://www.haomeiwen.com/subject/ztiszhtx.html