spark sql对seq值的包装

spark sql对seq值的包装

作者: 中科院_白乔 | 来源:发表于2017-09-05 20:20 被阅读0次

spark sql对seq值的包装
部分spark参数解析
Spark SQL中Dataframe join操作含null值
Spark SQL
Spark SQL运行原理和架构（十一）
SparkSQL简介
Spark SQL（Spark shell）
spark之旅-4.spark-sql
macOS下Spark SQL与Hive MySQL集成
Spark SQL

spark sql对seq(s1, s2, s3, ...)值的包装，seq的每个元素si会被包装成一个Row
如果si为一个简单值，则生成一个只包含一个value列的Row
如果si为一个N-Tuple，则生成一个包含N列的Row

特别的，如果N-Tuple是一元组，则视为非元组，即生成一个只包含一个value列的Row

scala> Seq(("bluejoe"),("alex")).toDF().show
+-------+
|  value|
+-------+
|bluejoe|
|   alex|
+-------+

scala> Seq("bluejoe","alex").toDF().show
+-------+
|  value|
+-------+
|bluejoe|
|   alex|
+-------+

scala> Seq(("bluejoe",1),("alex",0)).toDF().show
+-------+---+
|     _1| _2|
+-------+---+
|bluejoe|  1|
|   alex|  0|
+-------+---+

我特意编写了如下测试用例，验证了这种情况：

    @Test
    def testEncoderSchema() {
        val spark = SparkSession.builder.master("local[4]")
            .getOrCreate();
        val sqlContext = spark.sqlContext;
        import sqlContext.implicits._
        import org.apache.spark.sql.catalyst.encoders.encoderFor
        val schema1 = encoderFor[String].schema;
        val schema2 = encoderFor[(String)].schema;
        val schema3 = encoderFor[((String))].schema;

        Assert.assertEquals(schema1, schema2);
        Assert.assertEquals(schema1, schema3);
    }

相关文章

spark sql对seq值的包装
spark sql对seq(s1, s2, s3, ...)值的包装，seq的每个元素si会被包装成一个Row如果...
部分spark参数解析
配置值说明spark.sql.parquet.adaptiveFileSplittrue不知道spark.sql....
Spark SQL中Dataframe join操作含null值
当在Spark SQL中对两个Dataframe使用join时，当作为连接的字段的值含有null值。由于null表...
Spark SQL
Spark SQL Spark SQL的概述 Hive的诞生，主要是因为开发MapReduce程序对 Java 要...
Spark SQL运行原理和架构（十一）
一、Spark SQL运行架构 Spark SQL对SQL语句的处理和关系型数据库类似，即词法/语法解析、绑定、优...
SparkSQL简介
一、如何运行Spark SQL 查询 1.1、Spark SQL CLI 要启动Spark SQL CLI ，请...
Spark SQL（Spark shell）
一、Spark SQL基础 1、Spark SQL简介 Spark SQL是Spark用来处理结构化数据的一个模块...
spark之旅-4.spark-sql
Spark-SQL Spark-SQL，思维导图
macOS下Spark SQL与Hive MySQL集成
1 Spark SQL 与Hive集成（spark-shell） Spark SQL is Apache Spar...
Spark SQL
Spark on hive (Spark SQL):hive只是作为了存储的角色;Spark Sql作为计算的角色...

网友评论

本文标题：spark sql对seq值的包装

本文链接：https://www.haomeiwen.com/subject/lispjxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|spark sql对seq值的包装|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！