美文网首页MLSQL基础资源
MLSQL 开发环境配置指南

MLSQL 开发环境配置指南

作者: hongshen | 来源:发表于2019-03-20 12:07 被阅读161次

    MLSQL是一个非常棒的项目,为了更加了解该项目,我需要建立MLSQL的开发调试环境,由于项目目前已经比较成熟,搭建环境其实也比较简单,这里记录一下供参考。

    MLSQL大部分代码是scala编写的,采用maven管理整个项目,我使用的IDE是idea2018.2.1版本,整个过程跟一般的java项目导入没什么区别。

    java版本jdk1.8
    
    maven版本3.5.2
    

    第一步:把idea的scala插件加上

    左上角File->Settings->Plugins,框里搜索一下scala,如果没有安装搜不到结果,你点击下面中间的Browse repositories,往下翻,找到下图这个安装,安装完需要重启生效。



    第二步:下载代码导入ide

    我体验的是这个TRY分支,下载好代码之后,就可以导入IDE了
    File->New->Project from Existing sources,然后选中streamingpro-TRY目录名,导成maven项目

    导成maven项目
    image.png
    然后一路next到finish即可

    导入之后,IDEA会自动下载依赖,过程可能有点长,不过项目本身已经添加了国内的maven镜像地址,在帮助大家加速依赖的下载。


    已经添加了阿里云的maven镜像地址

    由于MLSQL支持多个spark版本和许多特性,在实际命令行编译的时候需要指定profiles
    具体用到了哪些profiles,大家可以参考MLSQL的文档编译部分,命令行编译的方式是这样的,比如我要支持spark2.4

    export MLSQL_SPARK_VERSION=2.4
    ./dev/package.sh
    

    执行一下,会看到具体的mvn命令,那么我们可以根据此设置IDE中的profile

    mvn clean package -DskipTests -Pscala-2.11 -Ponline -Phive-thrift-server -Pcarbondata -Pcrawler -Pdsl -Pxgboost -Pspark-2.4.0 -Pstreamingpro-spark-2.4.0-adaptor -plstreamingpro-mlsql -am -Pshade
    

    具体方式是点击IDEA右侧的maven projects工具按钮,我的电脑屏幕的问题,这俩词被挤到扭曲了,如下图所示,只需要在我们要的profile的名字前面打钩就可以了,打上勾之后,IDEA还有一个依赖下载的过程,因为不同的profile依赖不同。


    选择profiles

    第三步:idea启动该项目

    mlsql-engine本地模式的入口是LocalSparkServiceApp,等到profile关联的依赖全部下载完成之后,我们打开这个类,没有依赖错误的话,无需其他配置,就可以尝试启动,如果启动过程中有依赖错误,找不到类的情况,可能是IDEA的依赖还没有下载完成,或者索引还没有建完,这时候,可以等待,或者关闭重新打开这个项目重试。

    右键run或者debug
    启动之后4040端口是spark的ui地址,9003是engine的web地址,具体可以参考启动日志.
    启动后日志输出
    这时候验证下,打开chrome打开9003端口web ui,点击运行,执行这个例子,第一次执行可能需要一点时间
    image.png
    image.png
    到此,开发调试环境基本上搭好了。

    相关文章

      网友评论

        本文标题:MLSQL 开发环境配置指南

        本文链接:https://www.haomeiwen.com/subject/pxdzmqtx.html