本文为Coursera《机器学习基石》课程笔记,传送门:https://class.coursera.org/ntumlone-003/lecture
什么是机器学习
学习是从观察触发,听觉是一种观察,视觉是一种观察,也许甚至有更多例例如嗅觉或触觉都是一种观察,从这些观察出发,然后经过我们脑袋的内化转化的过程,最后变成有用的技巧和技能。这就是一个学习的过程。机器学习就是用电脑来模拟这样一个过程。
电脑的观察是什么?
我们喂给电脑的数据、电脑自己获取的数据。这些成为数据。电脑对这些数据进行计算,对应人脑的内化学习,然后得到有用的技巧。机器学习说穿了就是模仿人脑学习的过程。
技巧是什么?
技巧就是增进某一种东西的表现。比如数学变好,能解更难的题;预测股票更好,能靠股票赚更多钱。
所以,通俗的讲,机器学习的过程就是从数据出发,经过电脑的计算之后,最终得到某一种表现的增强(这个增强也是和组合规则最大的区别)。
为什么要用机器学习
如何辨认一棵树?
- 古老的方法:一排规则(但这并不容易,无法写全写对)
- 人的方法:我们是怎么样辨认一颗树的?是100条规则一条条判断吗?不是,是通过大量的观察,通过爸爸妈妈教我们这是一棵树那不是一棵树,我们自然就学会怎么样是一棵树怎么样不是一棵树
- 机器学习的方法:学习人的方法,让机器自己分析数据,自己学会如何去辨认
有用的场景
- 不知道有什么规则。把机器人送上火星前,我们不知道火星上都有什么状况,不可能该提前写好1000条2000条规则来告诉机器人碰到不同的规则该怎么做。有一大部分势必需要机器人上了火星之后再决定做什么,需要机器人透过学习,透过跟环境的互动来达到更好的表现
- 不容易写出规则。辨识声音、辨识图像,不容易写出规则,利用大量的数据,机器能学到如何去辨识
- 人想都没想过的。比如股票的超短线交易。5到10秒的买卖,人完全没想过这样做,但是电脑可以通过分析过去10到20年的股票数据,来预测是买入还是卖出
- 个性化服务。人不可能相处千万用户每个人的喜好,但机器可以分析每个人的行为经历,甚至可以联合上千万的用户数据分析,来生成个性化服务
- ...
机器学习的三个关键
- 某一种表现能够增进,即具有某一种潜藏的模式、规则是可以学习的
- 我们知道有潜藏的模式、规则,但我们不知道具体是什么样的模式、规则
- 必须要有能学习的资料
小测试:下面哪项适用机器学习
- 预测小女孩在偶数还是奇数的分钟哭
- 判断给定的数组中是否有素数
- 银行判断要不要给一个客户开信用卡,开多少额度
- 地球会不会因为使用核能而毁灭
答案:3,1明显没有潜藏的模式、规则;2有明显、可以写出的规则;4没有数据可以学习,地球还没毁灭过;3具有潜藏的模式、规则且不容易描述,并有大量历史数据可以学习
网友评论