把excel的数据导入spark，然后进行分析

作者: 大数据修行 | 来源:发表于2019-03-10 13:00 被阅读2次

把excel的数据导入spark，然后进行分析
【R语言】--- 各类数据的导入
2018-03-04 使用 selenium 模拟浏览器爬取动
Excel 文件结构化解析示例
Python-Excel 模块哪家强？
删除Excel重复数据的5种方法，你喜欢哪一种？
Python中强大的库，海量Excel数据都不怕
数据分析基础技能—Excel数据导入
js文件上传、导入报表excel
Excel 数据分析

package com.atguigu.product

import org.apache.spark.sql.{DataFrame, SQLContext}
import org.apache.spark.{SparkConf, SparkContext}

object SparkReadFileCsv {
  def main(args: Array[String]) {

//    val localpath="F:\\1.csv"
    val localpath="E:\\数据分析\\SQL第一部分\\company_sql.csv"
    val conf = new SparkConf()
    conf.setAppName("SparkReadFile")
    conf.setMaster("local")
    val sparkContext = new SparkContext(conf)
    val sqlContext = new SQLContext(sparkContext)
    //读csv文件
    val data: DataFrame = sqlContext.read.format("com.databricks.spark.csv")
      .option("header", "true") //在csv第一行有属性"true"，没有就是"false"
      .option("inferSchema", true.toString) //这是自动推断属性列的数据类型
      .load(localpath)

    data.show()
  }

}

这里在导入的时候出现了乱码的问题，这个csv的文件，要先转换为utf-8的模式。

把excel的数据导入spark，然后进行分析
这里在导入的时候出现了乱码的问题，这个csv的文件，要先转换为utf-8的模式。
【R语言】--- 各类数据的导入
通常情况下，我们会在excel中对数据进行预处理，然后将处理好的数据导入R中进行分析、作图。但随着数据源和数据格式...
2018-03-04 使用 selenium 模拟浏览器爬取动
前情提要: 女友毕业论文需要进行数据分析, 要从一个舆情网站爬取大量数据, 导入 excel 里进行分析. 遂做了...
Excel 文件结构化解析示例
在数据分析业务中，经常要把Excel文件数据结构化解析以后再进行计算或导入关系数据库，但许多Excel文件的格式并...
Python-Excel 模块哪家强？
前言从网页爬下来的大量数据需要excel清洗成堆的科学实验数据需要导入excel进行分析作为一名面向逼格的Pyt...
删除Excel重复数据的5种方法，你喜欢哪一种？
不管是手动输入数据还是系统导入数据，在做Excel数据分析前，必须对数据进行除重处理。这里罂粟姐姐分享4种Exc...
Python中强大的库，海量Excel数据都不怕
0. 前言从网页爬下来的大量数据需要清洗？成堆的科学实验数据需要导入 Excel 进行分析？有成堆的表格等待...
数据分析基础技能—Excel数据导入
上一篇文章：数据分析进阶技能——Excel连接数据库，教大家的是如何把数据库中的数据弄到Excel中进行提数分析。...
js文件上传、导入报表excel
这里导入分两种：1.导入excel数据到后台：批量导入2.导入excel数据到网页：单条导入导入的excel模...
Excel 数据分析
Excel数据可视化本文主要记录使用Excel进行数据分析，所使用的数据时一份招聘网站Excel 数据分析步骤 ...