来源:CPDA数据分析师网 / 作者:数据君
与人类思想融合向ML解决方案添加人员并不一定像看起来的那样简单
机器学习过程包含从数据探索到模型创建,从测试和验证到执行和体验的多个阶段,在数据科学家,主题专家或公众的干预下,大多数阶段都可以得到加强,人类通过提供ML解决方案不可能或效率低下的知识和能力来做出贡献,同时ML能够处理海量数据集,而这远远超出了专家观察的范围,典型的例子是安全性和分类问题,对于纯机械解决方案来说,对于庞大的人类专家团队而言,任务也太繁琐。
人在循环中的解决方案涵盖了人类专家和机器的最佳可能性
这样的解决方案将人类的专业知识扩展到了跨更广泛,更多样化的输入中的数据理解和操作上,它通过访问难以获得或难以使用的人类经验来帮助ML,所需知识可能来自人类社会,外部世界状况,隐藏数据,期望,内隐规则和行为约束,组合方法的另一个优点是可以消除偏差,人类专家有经验上的隐性偏见,ML可以帮助您识别这些偏差,但是可能还需要检查它是否存在虚假推断。
CPDA数据分析师许多公司已经将“循环中的人”作为机器学习操作原始模型的扩展
在该模型中,数据科学家总是可以随时评估和纠正结果,今天的主要区别是人类投入的民主化,将来将与ML互动的人们将永远不会是数据科学家,他们将是主题专家或普通大众。的确,与众包整合是一个有前途的机会,在那里,个人可以将集体经验带到ML程序解决的问题上,如今“在环人类”机器学习的例子包括使用自动人类评估来基于众包过滤筛选出某些类型的图像,该系统使用训练有素的人群来训练时尚分类程序;搜索引擎使用人类来建立ML的智能搜索,通过结合人类分类和ML来标记图像;和大多数当前的半自动车。
对业务和工作的影响
将人员集成到机器流程中将对ML在业务中的使用方式以及定义其对就业市场的影响产生重大影响,我们将需要混合流程,这些流程必须采用最有效的方式来整合人机功能,从更大的意义上讲,这不仅限于ML,还扩展到其他形式的AI和机器人技术,植入人类芯片的可能性有点遥远,但是随着自主过程和“智能”机器的普及,寻找人机交互的最佳位置越来越受到关注,人为干预和机器学习之间的接口需要进一步检查,要创建一个丰富的ML生态系统,很明显,必须为以这种方式雇用的人员定义角色和期望。
还需要更好地了解众包对ML的影响
随着数据科学家的可用性越来越低,人类输入的民主化变得势在必行。数十年前,BI民主化所面临的同样压力现在也适用于ML;流程需要由业务驱动,而不是仅由工程驱动,当我们进入这个未开发的新领域时,重要的是要牢记新情况会产生意想不到的结果,期待很快会有更多的发展。
网友评论