机器学习的定义
1、机器学习是这样的领域,它赋予计算机学习的能力,(这种学习能力)不是通过显著式编程获得的。
显著式编程需要提前告知计算机的一些规律,比如菊花是黄的,玫瑰是红的,以让其区分开。输入和输出固定了,如果问题过于复杂,输入会非常多,如机器人倒咖啡,要把机器人环境调查的一清二楚。
机器学习是给出大量数据,让其自己总结规律,事先不约束计算机总结出什么规律,让计算机自己挑出最能区分菊花和玫瑰(或其他事物)的一些规律。这种让计算机自己总结规律的编程方法叫做非显著式编程。计算机自由行为,并规定环境下的行为收益函数,让其自己寻找最大化收益函数的行为
2、一个计算机程序被称为可以学习,是指它能够针对某一个任务T和某个性能指标P,从经验E中学习。这种学习的特点是,它在T上的被P所衡量的性能,会随着经验E的增加而提高。
任务T:编写计算机程序识别菊花和玫瑰
经验E:一大堆菊花玫瑰的图片(训练样本)
性能指标P:不同机器学习算法会有不同,这里花的识别率作为性能指标。
根据经验E提高性能指标P的过程是典型的最优化问题,数学最优化理论均适用。
机器学习的分类
机器学习分类教计算机下棋(经验E由计算机与环境互动获得的)
垃圾邮件识别 (经验E由人收集并输入计算机)
人脸识别(经验E由人收集并输入计算机)
无人驾驶(经验E由计算机与环境互动获得的)
1、监督学习
- 把告诉计算机训练样本是什么的过程叫为训练数据打标签,如这个邮件是垃圾邮件,这张照片是张三。
- 经验E=训练样本和标签的集合
- 输入计算机训练数据同时加上标签的机器学习称为监督学习
传统监督学习:每一个训练数据都有对应的标签
非监督学习:所有监督数据都没有对应的标签
半监督学习:训练数据中一部分有标签,一部分没标签
2、强化学习
- 计算机产生行为,定义这些行为的收益函数,如到达目的地奖励,出事故惩罚,以及设计算法让计算机改变自己的行为模式去最大化收益函数,这一类机器学习叫强化学习,即计算机与环境互动强化自己的行为模式。
机器学习的两种算法(监督学习和强化学习)也常一起使用,如ALPHAGO前期使用监督学习,后期使用强化学习。
课程主要内容是用机器学习模型解决分类问题。
网友评论