他们的区别,无监督是训练集没有标准答案;监督学习是训练集都有标准答案;半监督学习是一小部分训练集有标准答案,大部分训练集没有标准答案;强化学习是给到奖励或惩罚的刺激,通过试错和反馈来进行学习。
一、监督学习
监督学习是指对已经打好标签的训练样本进行学习,目标是对训练样本集之外的数据进行预测的学习方式。
比如我们高考做考试题,标准答案已经有了,我们只需要记住这些答案,下次碰到了,知道1+1应该是等于2,就可以了。
常见的监督学习算法有:支持向量机(SVM),KNN,决策树,朴素贝叶斯,逻辑回归。
监督学习常见的应用场景:
-
1)垃圾邮件的识别。给到一个邮件,分辨出来这个邮件的类别:1 垃圾邮件,2 正常邮件
-
2)文本情感分析。给出一条评论,分辨出来这条评论的倾向:1 褒,2 贬
-
3)图像内容识别。给出一个图片,分辨出来这个图片是一个什么物体:猫、狗、人、车子等等
-
4)票房预测。给出一个电影相关的数据,运行出来结果数值:具体的数字
-
5)房价预测。给出一套房产相关的运行出来结果数值:具体的数字
二、无监督学习
无监督学习是指对没有打标签的样本进行学习,目标是发现训练样本的中的结构性知识。在这里,学习的样本是没有标记的。
比如我们去看画展,虽然对绘画流派一无所知,但我们也会根据自己的感受,去把画分成不同种类,即使我们不知道什么是抽象派,什么是写实派,也能根据画的特点把这两种类别的画进行区分。
常见的无监督学习算法有:聚类,PCA、生成对抗网络。
无监督学习常见的应用场景:
-
1)新闻的聚类。给出一批新闻,把这些新闻划分出不同的类别。
-
2)类似用户的挖掘。给出一批用户,分析出哪些用户比较相似。
三、半监督学习
半监督学习是指训练数据的一部分是有标签的,另一部分没有标签。这里是基于这样一个规律:通过一些有标签的局部特征和更多没有标签的整体分布就能得到比较好的识别效果。
这主要是因为对数据进行标记的代价有时很高,比如在生物学中,对某种蛋白质的结构分析或者功能鉴定,可能会花上生物学家很多年的工作,而大量的未标记的数据却很容易得到。
常见的半监督学习算法:TSVM,S3VM,生成式方法,半监督聚类。
半监督学习常见的应用场景:
-
1)医疗影像
-
2)金融风控
四、强化学习
强化学习是指没有任何的标签,但有一系列的奖励和惩罚规则,计算机通过不断尝试,从错误中学习,最后找到规律。
比如我们小时候玩的一个捉迷藏游戏,你的朋友会事先藏好一个东西,当你离这个东西越来越近的时候,你朋友就说热,越来越远的时候,你朋友会说冷。冷或者热就是一个奖惩函数。我们通过这个函数反馈的信息,不断调整自己的策略,最后赢得我们的游戏。
常见的强化学习算法有:Q-learning、Sarsa、Deep Q Network、Policy Gradient
强化学习常见的应用场景有:
-
1)著名的 AlphaGo下围棋
-
2)优化跨渠道营销和实时投标在线广告系统
-
3)工业机器人产品
网友评论