windows上spark shell读取本地文件

作者: yimengtianya1 | 来源:发表于2019-06-17 20:18 被阅读6次

windows上spark shell读取本地文件
spark shell 执行案例
SPARK命令行读取parquet数据
快乐大数据第8课 Spark计算引擎概述
Python | spark常用函数
Spark本地/集群执行wordcount程序
sparksql读取hive数据库代码（一）
Spark本地: Scala实例
2019-04-09问题总结
本地java程序连接阿里云服务器Hadoop失败

1、windows上spark shell读取本地文件时，需要在文件地址前加“file:///”
2、文本文件的后缀要有。
3、由于不知道默认读取位置，因此建议使用绝对路径。

如读取本地文件HelloSpark.txt：

    scala> val lines = sc.textFile("file:///C:/spark-2.4.3-bin-hadoop2.7/data/testfile/HelloSpark.txt")

    scala>  val lines = sc.textFile("file:///C:/spark-2.4.3-bin-hadoop2.7/data/testfile/HelloSpark.txt")
    lines: org.apache.spark.rdd.RDD[String] = file:///C:/spark-2.4.3-bin-hadoop2.7/data/testfile/HelloSpark.txt MapPartitionsRDD[15] at textFile at <console>:24

    scala> lines.first()
    res6: String = testfile

    scala> lines.count()
    res7: Long = 3

网友评论

本文标题：windows上spark shell读取本地文件

本文链接：https://www.haomeiwen.com/subject/angzfctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

windows上spark shell读取本地文件

相关文章

windows上spark shell读取本地文件

spark shell 执行案例

SPARK命令行读取parquet数据

快乐大数据第8课 Spark计算引擎概述

Python | spark常用函数

Spark本地/集群执行wordcount程序

sparksql读取hive数据库代码（一）

Spark本地: Scala实例

2019-04-09问题总结

本地java程序连接阿里云服务器Hadoop失败

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

机器学习与深度学习

数据蛙数据分析每周作业