美文网首页
读取数据源创建DataFrame

读取数据源创建DataFrame

作者: 扣篮的左手 | 来源:发表于2018-07-08 15:54 被阅读0次

读取文本文件创建DataFrame


定义样例类,3个数值映射到数组中的3个元素




这个RDD中存放的都是People对象。
接下来就可以把RDD转换成DataFrame




打印元信息:

每一行都是一个Row对象
DataFrame调用了RDD的collect方法,能够获取到里边的数据。DataFrame中有自身封装好的API。




两者地址相同

通过SparkSession构建DataFrame

使用spark-shell中已经初始化好的SparkSession对象spark生成DataFrame





读取json文件创建DataFrame

spark自带的样例

使用当中的people.json文件




相关文章

网友评论

      本文标题:读取数据源创建DataFrame

      本文链接:https://www.haomeiwen.com/subject/aqjouftx.html