【教程】5分钟在PAI算法市场发布自定义算法

【教程】5分钟在PAI算法市场发布自定义算法

作者: 暖忆_ | 来源:发表于2019-08-07 16:15 被阅读0次

【教程】5分钟在PAI算法市场发布自定义算法
【教程】5分钟在PAI算法市场发布自定义算法
5分钟在PAI算法市场发布自定义算法
『Power AI by AI』 PAI-AutoML2.0重磅
『Power AI by AI』 PAI-AutoML2.0重磅
PAI算法
阿里云机器学习PAI
EasyNLP简介
阿里巴巴大数据产品最新特性介绍--机器学习PAI
Python 算法第一章　介绍

概述

在人工智能领域存在这样的现象，很多用户有人工智能的需求，但是没有相关的技术能力。另外有一些人工智能专家空有一身武艺，但是找不到需求方。这意味着在需求和技术之间需要一种连接作为纽带。

今天PAI正式对外发布了“AI市场”以及“PAI自定义算法”两大功能，可以帮助用户5分钟将线下的spark算法或是pyspark算法发布成算法组件，并且支持组件发布到AI市场供更多用户使用。有了以上功能，算法开发者和算法需求双方可以基于PAI的开放框架和平台实现算法交易，实现生态和PAI的共融。

详细使用说明

价格说明

使用SQL、SPARK2.0、PYSPARK2.0 3种算法框架自行开发出的算法上传到PAI-STUDIO中，运行产生的费用按照PAI资源成本价收取，费用为1元/计算时。

功能详解

1.控制台说明

首先进入PAI控制台，找到Studio-可视化建模下的“算法发布”功能。

2.开发算法代码

基于本地调试文档https://help.aliyun.com/document_detail/126887.html，开发算法包。本文使用官方提供的pyspark案例介绍，请前往https://help.aliyun.com/document_detail/126889.html下载。

3.点击“创建自定义算法”

算法名称：算法组件的名字

算法唯一标示：算法的后台唯一标识，可以用来查询日志等信息

算法框架：sql、spark、pyspark

算法包：如果是sql算法，需要上传sql脚本。spark算法提交的是打包好的jar包。pyspark提交的是工程打包好的zip文件

算法种类：算法包发布到PAI-STUDIO后所在的文件夹

入口参数：sql组件不需要、spark需要写jar包的入口类（例：com.aliyun.odps.spark.examples.simhash.SimHashSpark）、pyspark需要写入口的py文件和入口函数（中间用.分隔）

本文使用官方提供的pyspark算法包，上传pyspark.zip文件，输入入口文件和入口函数

read_example.mainFunc

如图：

4.编辑版本

提交算法包后，在控制台可以看到算法包实例，这时候需要为算法包配置UI展示相关内容。

这里的版本指的是组件的UI展示形式，只有配置了版本的才可以发布。

点击添加版本：

点击前往配置进入组件配置界面，所有算法组件的配置可以通过拖拽的形式可视化操作。

5.组件UI编辑

组件的输入和输出桩可以在下图部分自由控制，本案例实现的是读一个表然后把其中两个字段写到另一个表里，对应代码中的inputTable1和outputTable1，如果多个输入输出桩可以在代码中定义inputTable2、inputTable3等，组件桩会自动映射。

#定义输入节点

INPUT_TABLE = arg_dict["inputTable1"]

OUTPUT_TABLE = arg_dict["outputTable1"]

ID_COL = arg_dict["idCol"]

CONTENT_COL = arg_dict["contentCol"]

本案例只使用了一个输入和一个输出，这部分不需要修改。

接下来编辑配置信息，在上述代码中除了inputTable和outputTable这两个参数，剩下的所有参数都要对应到组件的基础控件。本案例中idCol和contentCol两个参数对应的是输入表中选择的两个字段，都是单选。在左侧基础控件中找到“单字段填写控件”，因为是两个参数，所以拖两个出来。

单击第一个控件，在右侧基础信息中进行配置。

Name(必选项)：算法代码中参数的映射项，本案例应该写idCol。设置好后，说明算法代码中拿到的idCol信息就是该组件的输入

标签：该控件的展示名

converter：一般不用填写

绑定输入/输出：组件输入输出桩的绑定，本案例选择输入#1

支持的数据类型：默认全部支持

分别配置两个控件的信息对应到idCol和contentCol。

6.发布组件

编辑好UI版本，记得点击下方的保存按钮。

回到控制台，刷新页面，点击“使用此版本”

这时候组件就可以发布了，

发布分两种：

发布到PAI-STUDIO：发布到PAI-STUDIO需要选择区域和项目，发布过去的组件只能在当前项目下使用，并且主子账号共享

发布到数加智能市场：生成的组件会发布到AI市场，供所有PAI用户下载使用

7.组件调用

进入组件发布的PAI-STUDIO项目，在左侧“组件”tab下找到“自定义算法”文件夹，可以找到发布的算法并使用

相关文章

【教程】5分钟在PAI算法市场发布自定义算法
概述在人工智能领域存在这样的现象，很多用户有人工智能的需求，但是没有相关的技术能力。另外有一些人工智能专家空有一...
【教程】5分钟在PAI算法市场发布自定义算法
概述在人工智能领域存在这样的现象，很多用户有人工智能的需求，但是没有相关的技术能力。另外有一些人工智能专家空有一...
5分钟在PAI算法市场发布自定义算法
概述在人工智能领域存在这样的现象，很多用户有人工智能的需求，但是没有相关的技术能力。另外有一些人工智能专家空有一...
『Power AI by AI』 PAI-AutoML2.0重磅
PAI-AutoML调参服务是通过算法的方式解放用户调节算法参数的工作。自2018年8月发布PAI-AutoML1...
『Power AI by AI』 PAI-AutoML2.0重磅
PAI-AutoML调参服务是通过算法的方式解放用户调节算法参数的工作。自2018年8月发布PAI-AutoML1...
PAI算法
PAI算法
阿里云机器学习PAI
机器学习PAI 产品组成基础设施开放框架模型与算法业务应用层 PAI支持算法预处理工具操作特征工具统...
EasyNLP简介
EasyNLP中文NLP算法框架作者：PAI（阿里云人工智能平台）算法团队平台：基于PyTorch 优势：中文...
阿里巴巴大数据产品最新特性介绍--机器学习PAI
以下内容根据演讲视频以及PPT整理而成。本次分享主要围绕以下五个方面： PAI产品简介自定义算法上传数加智能...
Python 算法第一章　介绍
题学习使用教材＜Python算法教程＞ Python 算法教程在此进行记录，方便以后学习，加深记忆．

网友评论

本文标题：【教程】5分钟在PAI算法市场发布自定义算法

本文链接：https://www.haomeiwen.com/subject/mmzodctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|【教程】5分钟在PAI算法市场发布自定义算法|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！