machine learning 概览
machine learning是一个很大的理论体系,目前分为下面几类:
learning map
这里重点学习supervised learning,特点是训练集会附带label(正确的结果),模型会根据output与label比较,来不断调整自我调整。其中regression的output是scale(值);classification的output是class;structured learning的output远高级于前两者,比如语音识别的output是一段文字,人脸识别的output是一个人的信息等等类似这些复杂的output。
但是在现实场景中,很难搜集到大量的标有label的data set,这时我们一般采用semi-supervised learning。即data中既有labeled又有unlabeled。
如果data set中既有labeled又有unlabeled,并且还有not related to the task的data,这里引入了Transfer Learning。
而unsupervised learning就更厉害了,直接扔给machine一堆data,让machine自己去“读”,我个人理解为,给我(机器)一千本小说看,看完后我(机器)自己也可以写出一本小说。。。
最后一个reinforcement learning,是不会给机器的output一个确切的对错,而是给它一个分值,类似一个赏罚制度,machine在learning的过程中,output出了不错的结果时,会得到奖励,坏的结果会得到惩罚,久而久之,machine就根据这个来调整model。大热的阿尔法GO就是加入了reinforcement learning,DOTA2的openAI好像也是。
网友评论