机器学习真的有大家认为的那么难吗?
机器学习是否只能是科学家才可以用吗?
机器学习是否可以用更简单的方式呈现给大众?
该篇文章将给你一种机器学习的简单进入方式,期待与您一起。
机器学习已经与我们生活息息相关了
首先,先普及一下,机器学习和我们的生活有什么样的关系。
机器学习是数据智能很重要的实现方式,很多的优化生活的应用都用到了机器学习,比如以下几个耳熟能详的应用。
(1)今日头条
(2)京东,天猫等电商平台的猜你喜欢
(3)花椒、斗鱼、虎牙等直播平台主播的很多特效(计算机视觉有应用其中)
(4)科大讯飞和搜狗等的语音输入法
(5)微软小冰,酷Q 等聊天机器人
......
那么,这些应用中用到的最重要的核心技术是什么呢?
虽然不全是机器学习,但是,机器学习起到了举足轻重的作用。
比如今日头条至少用到了个性化推荐系统,京东等电商平台同样也用到了基于物品或者基于用户的推荐算法,今日头条和电商平台这二者同属于推荐系统;
而同样属于机器学习的计算机视觉则常常是直播,监控,安防,工业界的宠儿;
至于语音输入法和聊天机器人,它们则分别或多或少的应用到了机器学习中的语音识别和自然语言处理。
简而言之,机器学习可以说是一种优化人类生活,提高人类生产效率的好工具。
机器学习真的有大家认为的那么难吗?
机器学习不能说难,也不能说不难,而更恰当的描述方式可以是:或难或易。这就像任何一张考卷一样,上面总有简单的一些题,也总有难的一些题。机器学习也一样,有的难,有的不难,而有些不那么有天分的人却能从那些不难的部分入手,让自己感觉不难的开始,一步一步由易到难,而由于在简单的部分学得足够得多,理解得足够得多,思考得还算深入,而当某一刻遇到还有点难的部分,也比想象中的难度要低得多了。一句话概括,那就是由浅入深,找到容易切入的简单部分,志在必得,把难的部分当做对自己的挑战。这样,机器学习便不难入门。那接下来,在机器学习的简单部分不断探索的我将分享一些机器学习简单的打开方式给你。
机器学习是否只能是科学家才可以用的吗?
机器学习是科学家级别的人才创造的,但科学家创造的目的是给普通工作者使用的。正如计算机是科学家创造的,但是我们工作中用的PPT,WPS,Word等都是大众能用的。
机器学习虽然没有PPT,WPS,Word等那么简单,但也在朝着越来越简化的方向发展了。
比如,阿里云,腾讯云,百度云,第四范式,以及商汤科技都在大量的科学家研究的基础上开发出了类似PPT这样的服务(虽然没有PPT这样简单,但巨头公司都在努力改进)
以下我就将阿里云的机器学习PAI平台,百度云的,腾讯云的TBDS,第四范式的先知2.0的大致设计方向或者定位介绍给你。通过认识阿里云,腾讯云,百度云,第四范式的机器学习服务这种方式,从机器学习应用的层面来看,机器学习就没那么难,作为初学者可以从这个简单的部分入手,待有一定的积累,有成就感,甚至有足够的基础和信心之后,再接触更难的底层原理,那就有更强的学习能力了。
机器学习是否可以用更简单的方式呈现给大众?
以下的机器学习的使用形式在腾讯的TBDS,阿里的机器学习PAI,百度的BML和第四范式的先知都有类似的展现方式。
由于笔者有腾讯TBDS上的展示案例,所以以TBDS为例,如下图所示:
从图中可以看出,腾讯的TBDS将机器学习的37种常用机器学习算法和7种深度学习算法封装到左侧的组建框中,只需要弄清楚每个算法的输入输出,正如弄清楚一个手机工厂的输入是金钱,输出就是大量手机一样,中间的制造手机的过程无需关注。
那么,类似的,当我们注意输入输出的数据格式,学会查看出错的日志,找到定位错误的方法,通过类似搭建积木的方式,便相对轻松的搭建出一个复杂的机器学习网络。而其中的底层计算细节,说实话,就连科学家也很难彻底明白,所以有学者也称深度学习为一种黑箱。
TBDS这种界面化设计和算法封装,使得各种复杂的算法以一种可拖拽的模块框呈现给使用者,使用者仅仅通过托拉拽配的形式,以堆积木的方式便可进行机器学习模型的训练。
这对于初学者来说,不至于无法入门,可以通过这样的方式吸引感兴趣的朋友更感兴趣,畏难的朋友可以从这种可视化的堆积木式的操作切入。作为一个快速入门TBDS的先学者来说,笔者可以提供以下几个注意事项:
(1)注意数据输入路径,因为包括我在内的很多朋友都会遇到找不到输入路径,运行日志会清楚的告诉我们目录不存在的错误;
(2)参数带有*号的都为必填的,当不知道填什么的时候,填写部分的旁边都会有一个问号,当鼠标悬停在问好上面的时候,都有参数填写的说明。稍微认真阅读说明后,基本都知道该怎么填写;
(3)学会看日志,而看日志的方法一般也很简单,一般都只是右键,选择,点击,查看的简单步骤,如下图所示:
以上提供的堆积木式的机器学习,只是腾讯对机器学习的封装,除此之外的阿里云的机器学习PAI,百度的机器学习BML,第四范式的先知等,都有类似的设计,当我们熟练操作这种界面化的机器学习,再深入学习主要常用的算法的更深层的原理,机器学习必然没那么难。
总而言之,机器学习分为难和易2部分,其也遵守类似于二八定律的法则,有20%的那部分很难,但也有80%的部分是很容易掌握的,科学家可能专注的是难的那20%,而机器学习应用者更多的精力可以放在相对简单的80%,也同样能取得不小的收获,做出不小的成绩。
网友评论