spark+mongodb大数据框架搭建

作者: Alukar | 来源:发表于2018-05-09 20:01 被阅读65次

spark+mongodb大数据框架搭建
8 数据分析入门
MVVM框架的搭建（三）——网络请求
web前端开之网站搭建框架之vue详解
极速编程 native-react（3）
webpack 搭建react应用-babel不兼容
J2EE项目系列（四）--SSM框架构建积分系统和基本商品检索系
MVVM的数据持久化（一）——ROOM的集成
MVVM的数据持久化（二）——ROOM的使用
(3) spring-boot+druid+mybatis环境搭

spark依赖环境

1. jdk 1.8

2. scala 2.11

3. hadoop 2.7(本文用mongodb取代Hadoop HDFS，不需要安装)

安装JDK

略。。

安装Scala

Scala官网地址：http://www.scala-lang.org

选择2.11版本下载

解压:

tar -zxf scala-2.11.11.tgz

配置环境变量：

vim /etc/profile

使配置生效：

source /etc/profile

验证是否安装成功：

scala -version

安装spark

spark 下载地址: http://spark.apache.org/downloads.html

这里可以看到spark默认构建于Scala2.11，依赖Hadoop2.7

安装过程与Scala类似，解压缩:

tar -zxvf spark-2.2.0-bin-hadoop2.7.tgz

配置环境变量:

配置spark：

进入spark安装目录conf, 执行命令:

1. cp spark-env.sh.template spark-env.sh

2. vim spark-env.sh

在文件最后加入jdk, scala环境变量

启动spark:

进入spark安装目录sbin，执行命令:

./start-all.sh

验证:

安装mongodb

略..

mongo-spark

文本使用mongo官方的mongo-spark连接器，连接spark、mongodb。

mongo-spark github地址: https://github.com/mongodb/mongo-spark?jmp=hero。

mongo-spark使用非常简单，使用时将mongo-spark包引入即可。下面使用spark-shell测试连接是否成功。

spark连接mongodb

进入spark安装目录bin, 执行以下命令:

spark-shell

--conf "spark.mongodb.input.uri=mongodb://localhost:27017/dbName.collectionName?authSource=admin"//mongodb数据源

--conf "spark.mongodb.output.uri=mongodb://localhost:27017/dbName.collectionName?authSource=admin"//使用mongodb保存分析后的数据

--packages org.mongodb.spark:mongo-spark-connector_2.10:2.2.0 //引入mongo-spark包

使用mongo-spark查询数据:

import com.mongodb.spark._

import org.bson.Document

MongoSpark.load(sc).take(10).foreach(println)

成功返回数据，说明spark连接mongodb成功。

本文到此结束。后续将继续研究基于spark+mongodb架构的大数据分析。

学习大数据的朋友可以来大数据交流群：724693112 群里免费大数据学习视频和资料给大家，欢迎大家进去交流学习，大家一起学习一起进步！一个好的学习氛围，能让你的学习不再那么枯燥，也能让你学习中少踩一些坑。

spark+mongodb大数据框架搭建
spark依赖环境 1. jdk 1.8 2. scala 2.11 3. hadoop 2.7(本文用...
8 数据分析入门
1 确定分析思路梳洗分析思路==>搭建分析框架==>分析框架体系化 2 数据收集数据收集是指按照确定的数据分析框架...
MVVM框架的搭建（三）——网络请求
mvvm的网络框架的搭建 MVVM框架的搭建（一）——背景MVVM框架的搭建（二）——项目搭建MVVM框架的搭建（...
web前端开之网站搭建框架之vue详解
网站搭建框架之vue Vue是web前端快速搭建网站的框架之一。它与jQuery有所不同，是以数据驱动web界面（...
极速编程 native-react（3）
搭建服务器端，使用 express 框架搭建 restful 服务，数据库使用 mongodb。通过 jwt 进行...
webpack 搭建react应用-babel不兼容
大前端使用工具 npm webpack react本次升级脚手架搭建最新的框架搭建框架时，遇到了babel 使用不...
J2EE项目系列（四）--SSM框架构建积分系统和基本商品检索系
继续搭建我们的项目吧。现在是搭建商品的数据库以及Lucene框架整合。本系列：（一）SSM框架构建积分系统和基...
MVVM的数据持久化（一）——ROOM的集成
MVVM框架的搭建（一）——背景MVVM框架的搭建（二）——项目搭建MVVM框架的搭建（三）——网络请求MVVM的...
MVVM的数据持久化（二）——ROOM的使用
MVVM框架的搭建（一）——背景MVVM框架的搭建（二）——项目搭建MVVM框架的搭建（三）——网络请求MVVM的...
(3) spring-boot+druid+mybatis环境搭
本文以druid数据库连接池及mybatis框架，搭建基本的应用开发框架。 1、druid数据库连接池 1.1、D...