美文网首页
DataFrame的常用操作

DataFrame的常用操作

作者: 一个人一匹马 | 来源:发表于2019-02-21 15:47 被阅读0次

Java版本

​//打印DataFrame中所有的数据(select * from ...)
​​df.show();

​​//打印DataFrame的元数据(schema)
​​df.printSchema();

//查询某列所有数据
​​df.select("name").show();

//查询某几个列所有数据并对列进行计算
​​df.select(df.col("name"),df.col("age").plus(1)).show();

//过滤
​​df.filter(df.col("age").gt(18)).show();

//按照组进行统计
df.groupBy(df.col("age")).count().show();

Scala版本

df.select("name").show() 

df.select(df("name"), df("age") + 1).show() 

df.filter(df("age") > 21).show() 

df.groupBy("age").count().show() 

相关文章

网友评论

      本文标题:DataFrame的常用操作

      本文链接:https://www.haomeiwen.com/subject/vgzryqtx.html