美文网首页
Spark 落地Hive增量操作 insertInto() 与

Spark 落地Hive增量操作 insertInto() 与

作者: 多彩海洋 | 来源:发表于2020-04-05 16:48 被阅读0次

前言

  • saveAsTable()的默认策略是如果表存在就会报错
  • 使用spark做增量操作的时候,会看到有2个方法都可以做:
    insertInto 和 mode(SaveMode.Append).saveAsTable()

区别:

  • insertInto()
    无关schema,只按数据的顺序插入,类似hive导入csv.
  • mode(SaveMode.Append).saveAsTable()
    1.如果表已存在,需要匹配插入数据和已有数据的format,partiton等参数,如果有区别会插入出错.如:没有提供partitionBy.
    2.使用已存在的表的schema的column进行数据插入匹配

相关文章

网友评论

      本文标题:Spark 落地Hive增量操作 insertInto() 与

      本文链接:https://www.haomeiwen.com/subject/twnuphtx.html