美文网首页我爱编程
hbase-spark 简单实践

hbase-spark 简单实践

作者: wpb | 来源:发表于2016-10-08 20:44 被阅读0次

环境部署


$ docker pull nerdammer/hbase-phoenix
$ docker run  -d -p 2181:2181 -p 60000:60000 -p 60010:60010 -p 60020:60020 -p 60030:60030 nerdammer/hbase-phoenix

$ docker exec -i -t d90 bash
  # cd /opt/phoenix/bin/
  # ./sqlline.py 127.0.0.1:2181
    > CREATE TABLE INPUT_TABLE (id BIGINT NOT NULL PRIMARY KEY, col1 VARCHAR, col2 INTEGER);
    > CREATE TABLE OUTPUT_TABLE (id BIGINT NOT NULL PRIMARY KEY, col1 VARCHAR, col2 INTEGER);
    
  • ps 此处最好使用-p指定端口,同时添加container id到host中 避免后续客户端连上zk后获取到的host:port 无法访问

开发环境


  • 环境依赖

      libraryDependencies += "org.apache.phoenix" % "phoenix-spark" % "4.4.0-HBase-1.1
    
  • 代码片段:

streams.foreachRDD( rdd => {
println(s"rdd count: ${rdd.count()}")
val sqlContext = SQLContext.getOrCreate(rdd.sparkContext)
import sqlContext.implicits._
val dataFrame = rdd.toDF()
dataFrame.show()
dataFrame.write.format("org.apache.phoenix.spark").mode( SaveMode.Overwrite).options(Map("table" -> "OUTPUT_TABLE",
"zkUrl" -> "192.168.99.100:2181")).save()
 })

http://git.oschina.net/wangpeibin/codes/wonvmskrhcd9apfyetjgl60

参考资料


相关文章

  • hbase-spark 简单实践

    环境部署 ps 此处最好使用-p指定端口,同时添加container id到host中 避免后续客户端连上zk后...

  • Hbase-Spark BulkLoad 解析

    一、背景 项目中有需求,要频繁地、快速地向一个表中初始化数据。因此如何加载数据,如何提高速度是需要解决的问题。一般...

  • hbase-spark bulk load(二)

    概述 之前写过spark批量导入Hbase的案例:Spark、BulkLoad Hbase、单列、多列,实现了多列...

  • 简单socket实践

    简单socket实践,实际项目中应用 项目中用到的AndroidAsyncNetwork Connection C...

  • 实践喜欢简单

    道理都是浅显易懂的,但是添油加醋自以为是的往里面加东西就把简单的道理给弄复杂了,道理还有一个非常重要的特点就是...

  • Django简单实践

    在浏览器中输入 ip:port/path1/path2/ 程序解析过程 首先根据 urlrs.py解析具体的路径,...

  • Spring Security的学习链接

    Spring Security实践(一):简介 - 简书 Spring Security实践(二):简单认证的实现...

  • OpenGL ES 实践

    OpenGL ES实践(一)—— 一个简单的小程序OpenGL ES实践(二)—— 一个简单的三角形OpenGL ...

  • RunLoop

    RunLoop简单概述 RunLoop相关类 RunLoop逻辑处理 RunLoop实践 RunLoop简单概述 ...

  • 初识 K8s,创建一个guestbook留言簿应用 【K8s |

    课后实践:Kubernetes 核心概念 1. 目标概述 本文介绍一个简单的K8s上手应用,希望通过这个简单的实践...

网友评论

    本文标题:hbase-spark 简单实践

    本文链接:https://www.haomeiwen.com/subject/tyqlyttx.html