9.pyspark.sql.WindowSpec

9.pyspark.sql.WindowSpec

作者: 丫丫iii | 来源:发表于2019-01-24 17:24 被阅读0次

9.pyspark.sql.WindowSpec

Spark SQL和DataFrames重要的类有：

pyspark.sql.SQLContext： DataFrame和SQL方法的主入口
pyspark.sql.DataFrame：将分布式数据集分组到指定列名的数据框中
pyspark.sql.Column ：DataFrame中的列
pyspark.sql.Row： DataFrame数据的行
pyspark.sql.HiveContext：访问Hive数据的主入口
pyspark.sql.GroupedData：由DataFrame.groupBy()创建的聚合方法集
pyspark.sql.DataFrameNaFunctions：处理丢失数据(空数据)的方法
pyspark.sql.DataFrameStatFunctions：统计功能的方法
-pyspark.sql.functions DataFrame：可用的内置函数
pyspark.sql.types：可用的数据类型列表
pyspark.sql.Window：用于处理窗口函数

9.pyspark.sql.WindowSpec(jspec):定义分区，排序和边框界的窗口规范。使用Window中的静态方法创建一个WIndowSpec

9.1.orderBy(*col):定义windowSpec中的排列顺序

9.2.partitionBy(*col):定义WindowSpec中的分区列。

9.3.rangeBetween(start,end):定义从开始（包含）到结束（包含）的框边界。start, end都是相对于当前行。例如，“0”表示“当前行”，而“-1”表示在当前行之前一次，“5”表示当前行之后五次关闭。

1.start:开始边界（包括）。 如果这是-sys.maxsize（或更低），则该框架是无限的。
2.end:结束边界（包括）。如果这是sys.maxsize（或更高），则该框架是无限的。

9.4.rowsBetween(start,end):定义从开始（包含）到结束（包含）的框边界。start, end都是相对于当前行。例如，“0”表示“当前行”，而“-1”表示在当前行之前一次，“5”表示当前行之后五次关闭。

1.start:开始边界（包括）。 如果这是-sys.maxsize（或更低），则该框架是无限的。
2.end:结束边界（包括）。如果这是sys.maxsize（或更高），则该框架是无限的。

相关文章

9.pyspark.sql.WindowSpec
Spark SQL和DataFrames重要的类有： pyspark.sql.SQLContext： DataFr...

网友评论

本文标题：9.pyspark.sql.WindowSpec

本文链接：https://www.haomeiwen.com/subject/hzrujqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|9.pyspark.sql.WindowSpec|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！