美文网首页
TiSpark客户端(SpringBoot实现版)

TiSpark客户端(SpringBoot实现版)

作者: darkranger | 来源:发表于2017-11-01 20:02 被阅读0次

    安装完tidb集群环境后,我就需要编写一个客户端来访问tidb,使用tispark来编写相应的业务需求功能。不过坑太多了,当中我碰到各种问题,在此文中我会先把相应的过程记录下来,再告诉大家我碰到的几个坑和解决方案。并提供我的代码示例在文后

    准备

    1.最方便的做法
    在项目的doc目录下,将tispark-0.1.0-SNAPSHOT.jar
    按照如下格式

    <dependency>
           <groupId>com.pingcap.tispark</groupId>
           <artifactId>tispark</artifactId>
           <version>0.1.0-SNAPSHOT</version>
    </dependency>
    

    上传到你自己的maven私服即可
    2.比较麻烦的做法
    访问github,按照下列步骤打包编译tispark-0.1.0-SNAPSHOT.jar
    首先你要打包编译tikv-client
    项目路径
    https://github.com/pingcap/tikv-client-lib-java/tree/c050a3f69e2a2ed15b6358a37a52f05b314b795e

    打包tikv-client项目

    git clone https://github.com/pingcap/tikv-client-lib-java.git
    mvn clean install -DskipTests -Dmaven.test.skip=true
    

    接着打包编译tispark

    项目路径
    https://github.com/pingcap/tispark

    打包tispark项目

    git clone https://github.com/pingcap/tispark.git
    mvn clean install -DskipTests -Dmaven.test.skip=true
    

    在target目录下找到tispark-0.1.0-SNAPSHOT.jar,按照1所述上传到自己的maven私服即可

    项目编译

    mvn clean install -DskipTests -Dmaven.test.skip=true
    

    解释

    见SparkConfig.java文件,如下

    图1.png

    通过Builder模式创建SparkSession实例(相应的application名字,tidb的PD Server地址以及spark服务主节点地址通过SparkProperties从属性文件中读取),然后初始化TiContext上下文对象,映射的数据库名就是前文
    《TiDB初体验》 中搭建的mysql数据库名。返回的TiContext对象可通过依赖注入在需要的地方引用。比如DemoServiceImpl类中,读取customer数据库表的数据

    图2.png

    问题

    版本问题

    我的tidb集群环境其中集成的spark是2.1.1版本,因此自身的springboot项目的pom文件中的spark依赖包版本要与之对应,见下图

    图3.png

    依赖包缺失

    SparkConfig中需要设定pd server的ip和端口,这样执行TisparkDemoApplication类时不会报错,否则会报找不到spark.tispark.pd.addresses错误,如下图


    图4.png

    TiKV-client的依赖声明要显式声明

    也就说下面这段pom文件里必须要有

    <dependency>
         <groupId>com.pingcap.tikv</groupId>
         <artifactId>tikv-client</artifactId>
         <version>0.1.0-SNAPSHOT</version>
    </dependency>
    

    否则会报下图红框中的错误

    图5.png

    TiKV端口随机生成

    因为tidb集群中tikv节点的端口,在启动时都是随机生成的,这就带来一个问题。开发用的电脑是外网,要访问tidb集群必须要做端口映射,但是每次启动TisparkDemoApplication类时需要访问的tikv节点端口都是随机生成的,无法提前预知端口号来进行映射,从而造成每次都连接不到tikv节点。tidb的PD Server就会不停重试连接,到达一定次数会报exhaust错误。见下图红框

    图6.png

    这个问题困扰了我很久,后来我终于下定决心直接在本机打包,把jar包上传到tidb集群的PD Server,执行springboot的fat jar模式命令运行。毕竟在集群环境不需要做外网端口映射啊~
    附上命令

    java -jar /usr/local/tispark-demo-0.1.jar
    

    参考链接

    [1]tikv-client

    [2]tispark

    [3]我的代码示例(码云)

    [4]我的代码示例(github)

    相关文章

      网友评论

          本文标题:TiSpark客户端(SpringBoot实现版)

          本文链接:https://www.haomeiwen.com/subject/jmxmpxtx.html