美文网首页
[SparkSQL] Rdd转化DataFrame 通过Stru

[SparkSQL] Rdd转化DataFrame 通过Stru

作者: 林沐之森 | 来源:发表于2019-08-10 17:39 被阅读0次

    1、开发环境

    spark-2.1.0-bin-hadoop2.6

    2、Rdd转换成DataFrame,为字段添加列信息

    参数 nullable 说明:Indicates if values of this field can be null values

    val schema = StructType(List(
      StructField("name", StringType, nullable = false),
      StructField("age", IntegerType, nullable = true),
      StructField("money", DoubleType, nullable = true),
      StructField("hobbies", DataTypes.createArrayType(StringType), nullable = true)
    )
    )
    
    val flatMapDF = sparkSession.createDataFrame(flatMapRdd, schema)
    
    

    3、特别注意

    Array类型数据,需要通过 DataTypes.createArrayType(StringType) 生成相应 DateType类型数据,而不能使用ArrayType。否则会产生如下报错:

    相关文章

      网友评论

          本文标题:[SparkSQL] Rdd转化DataFrame 通过Stru

          本文链接:https://www.haomeiwen.com/subject/kyusjctx.html