本文选择使用 SAP Leonardo 里的 一个Product Image Classification API,即给定一张产品的图片,该 API 能识别出此产品的类别。
简要了解一下这个 API 的功能:该API 模型是由 SAP 基于大约5万张 Icecat 图片训练而成,能区分29种不同的类别,这些类别具体罗列于官方文档上,比如电脑显示器,数码相机,外部存储设备,键盘,液晶电视,手机充电器,笔记本和其他外设等等。如果我们消费这个API时指定的图片代表的产品不属于这 29 种类别之一,API 的表现如何?先卖个关子,文末解答。
data:image/s3,"s3://crabby-images/02cef/02cef616bc9f0d61b323fe8325ccb4dfa5310fe2" alt=""
这里假定我们已经找到了该 API,点击进入明细页面,将 API Key复制下来,后续的UI5应用需要使用到。
data:image/s3,"s3://crabby-images/40281/4028147c8201bc37ccd7495369324c4c8198ff27" alt=""
data:image/s3,"s3://crabby-images/934cd/934cd465a58083da757a5f2de46be1757f182d59" alt=""
然后进入SAP云平台的 Neo环境。本文介绍的步骤,使用免费的SAP Cloud Platform Neo测试环境即可。
data:image/s3,"s3://crabby-images/2de63/2de63dbf8dae1772217f28c11c10e4935526cd0b" alt=""
在Service列表里找到 WebIDE——我们将使用WebIDE进行UI5应用的开发。
data:image/s3,"s3://crabby-images/1b418/1b418c5f1a236b8bfee791aa8da74838a5eb95f9" alt=""
大家可以直接在 WebIDE 里 clone 这个 Github 仓库,或者把仓库的内容以zip包的形式下载到本地,再使用WebIDE的本地Import功能导入。
data:image/s3,"s3://crabby-images/ee698/ee698eaf794014210b1685394db571d4bf89da79" alt=""
data:image/s3,"s3://crabby-images/03d20/03d20f5c223aeb00162a16453b62e8012d2801b4" alt=""
我们要告诉 UI5应用这个API的url,因此在Neo环境里创建一个Destination(作用和ABAP Netweaver事务码SM59里创建的Destination相同):
data:image/s3,"s3://crabby-images/4d7c0/4d7c0603bcb6b08b4065ab8bc946b1b0cb8eb337" alt=""
属性如上图所示,因为是Neo测试环境,所以url为对应的sandbox环境:
https://sandbox.api.sap.com/ml
记下这个Destination名称 sapui5ml-api, 因为稍后的 UI5 代码里需要使用。
记得维护额外的属性WebIDEnabled为true,这样该Destination才能在UI5应用里被使用。点击Check Connection确保看到绿灯。
data:image/s3,"s3://crabby-images/6ca2e/6ca2e77443726fa15343bba3aa1ab217be96bee6" alt=""
打开WebIDE里UI5工程里的settings.json文件,将您之前从API console里拷贝的API Key粘贴到此处:
data:image/s3,"s3://crabby-images/cabda/cabda593a703b44746ba7b989e0c9263141013e0" alt=""
在项目根目录下的neo-app.json文件里,把类型为destination的target对象的名称维护成之前在SAP Cloud Platform Cockpit里创建的destination相同的名称。
data:image/s3,"s3://crabby-images/ac989/ac989b848372e0f18f3f6fe7103c42df4367b53e" alt=""
运行这个UI5应用,能看到如下界面:
data:image/s3,"s3://crabby-images/eb48a/eb48a1af2e9bcb2ce2152fb3947b6f8ec1530f19" alt=""
做一些简单的测试:
data:image/s3,"s3://crabby-images/16a36/16a36035f72bdf4eec0ef4467418cee697a7fe19" alt=""
SAP Leonardo的机器学习API,识别出这张图片有74.7%的可能性是一台笔记本电脑,13.8%的可能性是键盘,11.3%的可能性是Tablets.
data:image/s3,"s3://crabby-images/6ce09/6ce09273e68bc42d0346fe935be06a0f0b52aa72" alt=""
点击按钮 View JSON,能看到调用 SAP Leonardo API 返回的技术明细。
data:image/s3,"s3://crabby-images/b73cc/b73cc4365d4d0f401f16c47d50b62568c8a380a4" alt=""
鼠标的图片也成功识别出来了:
data:image/s3,"s3://crabby-images/9b2b5/9b2b51eca64e88b921e09417ce00b3c4d8da7847" alt=""
本文开头提到,Product Image Classification API 只支持29种产品类别:
data:image/s3,"s3://crabby-images/fb048/fb0487c0f1b6d7de2c94944fab05d412de9fb640" alt=""
如果我们开发应用时需要支持额外的产品类别,就需要自行提供该产品类别的图片来重新训练模型。
data:image/s3,"s3://crabby-images/61e2d/61e2deffb564d0f04a3d10c6742e36e16c17dcf9" alt=""
下面介绍SAP Leonardo上机器学习模型的重新训练步骤。
假设我们期望重新训练之后,Product Image Classfication这个模型能够识别出不同种类的花,那么我们首先得搞到大量花的图片。Tensorflow的官网上,已经体贴地给想做模型训练的学习者们,提供了一个做练习用的压缩包,里面包含了大量各式花的图片。
SAP Leonardo接受的能用于重新训练模型的数据集,必须符合下图所示的层级结构,即training, validation和test三个文件夹下面,分别包含以产品类别命名的子文件夹,且数据规模之比为8:1:1.
data:image/s3,"s3://crabby-images/b4c55/b4c557e925dd680bc164795d18b1c03017928d1c" alt=""
有了用于训练的数据后,下一步就是把这些数据上传到SAP Leonardo的模型在线存储平台上。
在 SAP 云平台上创建 Leonardo 机器学习的服务实例,这个实例的 service key 里包含了一个IMAGE_RETRAIN_API_URL,可以用来获取在线存储的url:
data:image/s3,"s3://crabby-images/76ec7/76ec789a8c805bee335cd981f7fc66652f5f4604" alt=""
向这个url发送一个HTTP get请求,得到在线存储的url:
data:image/s3,"s3://crabby-images/c9399/c939920574e94f7ae8dfde6888c135b8b3f70abe" alt=""
把这个url粘贴到浏览器里,输入postman里返回的accessKey和secretKey登录,就能以web的方式访问这个在线存储了:
data:image/s3,"s3://crabby-images/3c9b4/3c9b48b7dfa686d6979ca9d127d4908fd4c060bf" alt=""
下一步是把本地的训练文件上传到这个部署在AWS上的在线存储上去。
首先用命令行 mc config host
定义一个名为sapjerrys3的远程站点,将上一步从postman获得的AWS在线存储url,accessKey和secret绑定到这个站点上:
data:image/s3,"s3://crabby-images/ce85b/ce85b8bbfb9a9b1c1580fecbdd7f758043d6ebd0" alt=""
然后使用命令行上传文件:
mc.exe cp -r C:\Code\MachineLearningStudy\flowersjerry sapjerrys3\data
大概十几分钟后,文件上传完毕:
data:image/s3,"s3://crabby-images/d5e68/d5e68e5db44e473b05f2c3a6511b3ed5cea57f0b" alt=""
此时可以从浏览器里看到AWS在线存储上传完毕的训练文件。
data:image/s3,"s3://crabby-images/62d4a/62d4aa6e95ecc9c2dce67c568ce86c911e3ae982" alt=""
现在可以提交一个后台作业了,让Leonardo去处理这些上传好的文件,ABAP顾问们可以把这个动作理解成在Netweaver事务码SM36里定义一个后台作业并提交。发送一个HTTP post请求,除了下图jobName, dataset和modelName需要自己维护外,其他字段都使用SAP官网上定义的默认值。
data:image/s3,"s3://crabby-images/0e081/0e0819369556879577fd2e48c41ab3acebf81579" alt=""
这个请求会返回一个后台作业ID,抄下来后把它拼到url末尾,然后重新发送一个HTTP get请求,即可查询到这个作业的执行情况。Jerry重新训练的时候,等待了大概五分钟,作业状态就变为SUCCEEDED了。
data:image/s3,"s3://crabby-images/55551/55551fe3a9cb62ccd069bb587bf250b9309af708" alt=""
因为本文做的练习都是在SAP Cloud Platform的CloudFoundry环境中进行的,因此我们也可以用cf命令行来查询这些作业的执行情况:
cf sapml retraining jobs -m image
data:image/s3,"s3://crabby-images/915ca/915ca7d5ee1991d1e5147f2b3dd1badec2863c58" alt=""
如果遇到作业状态为FAILED的情况,去AWS在线存储上查看以作业名称命名的文件夹,里面包含了详细的训练日志,可以用作错误分析:
data:image/s3,"s3://crabby-images/c4a3f/c4a3f69594768406580ab2a4027e09fd190e839c" alt=""
在这个训练好的模型能正式被使用之前,我们还需要对其进行部署,类似ABAP Netweaver里的“激活”动作。
data:image/s3,"s3://crabby-images/b6aa1/b6aa14fbe9200be0659b58eec4e480864a0be2b8" alt=""
和提交训练的后台作业类似,模型部署也是一个异步执行的步骤,提交部署请求后,得到一个部署作业ID:ms-26c5a22c-6d07-4164-8222-a4182969162d
data:image/s3,"s3://crabby-images/025b0/025b0ac88097e59af09da59685725b02d6a29190" alt=""
根据这个部署作业ID可以查询模型部署状态:
data:image/s3,"s3://crabby-images/4e8af/4e8af0bbf65aec758011eda170c9ad0d57fe7b35" alt=""
成功部署后,我们就可以用Restful API消费这个模型了,url的格式为:
https://mlfinternalproduction-image-classifier.cfapps.sap.hana.ondemand.com/api/v2/image/classification/models/<model name>/versions/1
我从网络上随便找一张向日葵的照片,
data:image/s3,"s3://crabby-images/27b76/27b76ee58442a2ac2487b9b66b641a6aa4c90178" alt=""
将这张图片作为HTTP POST的参数发给我重新训练并且部署好的模型flowerjerrymodel,得到的结果显示,重新训练后的模型认为这张图片有大约87%的可能性是代表向日葵。
data:image/s3,"s3://crabby-images/7489e/7489eecaf7609a59bd5761eae37fc874da8c251d" alt=""
至此,这个机器模型重新训练和消费的步骤就成功完成了。
总结
本文首先介绍了使用 SAP UI5 前端框架开发的 Web 应用如何通过 Restful API 的方式消费 SAP Leonardo 平台提供的机器学习服务,然后以向日葵模型为例,介绍了 Leonardo 平台上机器学习模型重新训练和消费的详细步骤。
网友评论