Spark SQL 写入hive表字段名称或者类型不一致

作者: 团团饱饱 | 来源:发表于2021-01-17 10:58 被阅读0次

解决方案：

val targetTableSchemaArray = spark.catalog.listColumns(dbName, tableName).
      select("name", "dataType", "isPartition", "isBucket").
      rdd.map(catalog => {
      val name = catalog.getAs("name").toString
      val typeName = catalog.getAs("dataType").toString
      val isPartition = catalog.getAs("isPartition").toString.toBoolean
      val isBucket = catalog.getAs("isBucket").toString.toBoolean

      (name, typeName, isPartition, isBucket)
    }).collect()

    targetTableSchemaArray.foreach(x => {
      val name = x._1
      val typeName = x._2
      //判读字段名称和字段类型是否和目标表一致，如果不一致，抛出异常
      val sourcetypeName = sourceSchemaMap.getOrElse(name, "None")

      sourcetypeName match {
        case "None" => throw new Exception(s"Source table not exist ${name} column")
        case typeName => println("yes")
        case _ => throw new Exception(s"Inconsistent table structure types ,details：spark -> ${name}:${sourcetypeName} \t hive -> ${name}:${typeName} ")
      }
    })

网友评论

本文标题：Spark SQL 写入hive表字段名称或者类型不一致

本文链接：https://www.haomeiwen.com/subject/dtgnaktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Spark SQL 写入hive表字段名称或者类型不一致

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

Spark SQL 写入hive表 字段名称或者类型不一致

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

Spark SQL 写入hive表字段名称或者类型不一致