美文网首页产品经理AI时代人工智能时代(AI)
【讲座笔记】基于文本智能技术的AI产品设计实践

【讲座笔记】基于文本智能技术的AI产品设计实践

作者: 子归啼 | 来源:发表于2019-06-05 17:38 被阅读18次

    演讲者:贾学峰(达观数据副总裁),10年+产品设计和技术团队管理经验,SAP中国研究院高级经理,阿里巴巴数据创新产品负责人。算法开发、机器学习平台搭建,创新产品研发和商业化。

    公认的理解层次,目前正在第三层突破

    一、概念

    文本智能:通俗来讲,希望计算机像人类一样理解自然语言。

    文本可以分为书面文本和自然语言转化的文本。书面文本如简历、合同、新闻报道,书面文本可以很容易将其中的内容结构化,进行庖丁解牛似的拆解,抽取出信息进行联接,形成一个知识网。(这就是目前最有价值的方向)生成则是基于已有的规则和逻辑,由机器生成以前从来没有过的信息。比如机器写新闻、机器做海报、机器写乐曲等等。

    这里具体的表现就太多了,标签提取和观点提取、文本主题分类和情感识别、文本审核等等。这里举个例子,对于金融投融资行业从业人员来说,不可能看完几百页的债券募集说明书。那么可以采用算法将每篇文章中的关键信息抽取出来。

    设计思维:以用户为中心,强调敏捷开发和快速迭代。

    AI算法和基于AI算法的产品设计是不同的,设计思维就是要求设计人员从用户、场景和需求的角度出发,去思考要以什么样的形式解决用户的核心诉求。目标用户是谁,在什么场景下去使用我们的产品,是怎么用的等。其中可能涉及到找MVP进行验证,寻找PMF点(与产品匹配的市场角度)具体涉及到的6个方面如下图:

    设计思维的概念

    机器学习:以数据为中心,数据和模型进行闭环驱动。

    首先是对我们要解决的问题进行定义,然后根据问题的类型选择学术界已有的算法和模型(当然自己搞出来的也可以)去验证,初步满足业务要求之后就可以放在线上去使用了,当有新数据输入,就对模型进行训练,不同的新数据训练出的模型是不一样的,最后输出一个结果。这个过程是随着输入数据的增加和业务的发展逐渐迭代优化的。

    二、如何找到AI赋能的场景

    行业知识非常重要!!!互联网行业应用:提升生产过程中的信息传递效率。企业级应用:提升生产效率和创造新价值。

    以一个常见的报销流程来举例说明AI场景如何寻找。

    第一步,梳理业务流程有5个步骤:整理发票-填写报销申请单-上传票据-审核-通过收款。

    第二步,拆解每个步骤要做的具体工作。比如整理票据的时候要分类、计算总额、甚至有合规性检查。填写步骤就是报销类型、报销金额等业务系统必填字段一个个填进去。上传票据可能还包括打印申请表,贴票等工作。财务部审核票据的合规性、报销金额和票据金额的一致性、申报日期等。审核通过,财务放款后续通知等。

    第三步,评估每个具体内容中AI技术能够帮助解决的痛点。比如票据分类,可否用AI技术自动提取到票据中的关键信息后自动分类?发票可否自动进行合规、真假校验?(从源头降低财务审核的负担)发票可否自动分类加总和?(要自己一个个按计算器加也是蛮费时的,还不必说有人会加错、看漏数字) 填写报销单可否实现自动填写?(既然发票可以提取到关键信息,金额、类别一行应该可以通过接口自动填入申请单)上传发票能不能拍照直接上传,实现无纸化办公?(这个依据每个公司对接的税务机构,有的税务机构要求必须有纸质发票。)这样在财务部门审核环节,很多项目就不用浪费人力去进行复核了。在这里,可以建立员工信用系统,如果多次报销不出错,报销金额不超过标准的情况下,可以免审核,直接过。这样员工收到报销款的周期不是大大缩短了吗?简直不能再爽了!

    第四步,每一步就要提交数据和模型的训练样本啦!各种发票和票据多多收集(有稳定的数据来源不,这里涉及到项目的可行性),提高算法的准确率,达到既定的标准后就测试发布吧。

    举个例子

    三、AI产品设计原则

    AI驱动的软件在设计过程中,结果存在不确定性的,这样用户在使用时候的感觉可能是“有时候还是蛮准的,有时候又识别不出来”。在这种情况下,如果是使用传统软件的用户可能就会想这事系统的问题,系统不稳定,能正常使用吗?但是如果是知道软件由AI驱动的就应该明白,系统是没有问题的,不是所有的尝试都会成功。

    既然算法本身就是带有不确定性的,那么如何从产品设计上消除用户的疑虑呢?

    ①在不确定性出现的时候,需要跟用户澄清。比如系统在抽取合同信息的时候,有两个信息的匹配程度很低(极有可能是错误的),那么在设计上需要提示用户:这两个信息可能提取有误,请您手动核对。还比如在商旅业务处理上,用户说我明天要去北京开会,那系统里要是判定用户填出差申请单和订机票的概率相差不大,那在设计上要询问用户:您是要填写出差申请单,还是订机票?(这一条规则算是通用性的了)

    ②新数据源源不断进入系统,注重学习反馈。用户对于结果的反馈是非常重要的,至于人如何反馈呢?可能会涉及到人机交互的。(其实这条规则就是微软设计18条中第四部分讲到的内容)

    ③注重检测错误。线上数据的处理比较有挑战性,特别是对于有些私有化部署的系统。客户数据具有高度机密性,不可能导出真实的数据让开发人员去分析、去研究复现的。所以运维和产品人员要注意分辨反馈中的错误,并反馈给开发人员。(第三条对我来说没有什么共鸣的地方!可操作性不高!不具有指导性)

    达观数据的实例:合同信息抽取——规则审核

    通过历史合同去训练AI模型,让模型能够去识别不同类型的合同(租赁合同、劳动合同、采购合同),并且就不同类型的关键信息做抽取。站在使用者的角度,只需要上传合同,然后等待提取结果就可以了。

    至于规则审核,就需要对每一类合同内置风险审核项——内置规则。学习之后就可以对上传的合同进行审核了。


    相关文章

      网友评论

        本文标题:【讲座笔记】基于文本智能技术的AI产品设计实践

        本文链接:https://www.haomeiwen.com/subject/jiirxctx.html