美文网首页
《Machine Learning Foundation》读书笔

《Machine Learning Foundation》读书笔

作者: WEI_FENG | 来源:发表于2019-01-28 21:38 被阅读0次

    Type of Learning

    一、Learning with Different Output Space Y

    在之前两章的学习中我们引入了银行发卡的问题,这是一个典型的二元分类的问题。就是说输出结果就只有两个,一般是y={-1,+1}。

    二元分类的问题是很常见的问题,包括信用卡发放、垃圾邮件的判断、患者疾病的诊断、答案正确性的估计等问题。二元分类是机器学习领域非常核心和基本的一类问题。二元分类有线性模型也有非线性模型,根据不同的问题我们选择不同的模型。选取不同的算法:PLA和Pocket Algorithm。


    图1.png

    除了二元分类,也有多元分类问题。多元分类的输出多有两个,y={1,2,3...K},K>2.一般多元分类的应用有数字认别、图像识别等等。


    图2
    二元分类和多元分类都属于分类问题,它的输出都是离散数值。对于另外一种情况,比如训练模型,预测房价、股票收益多少等,这类问题的输出y=R,就是范围在整个实数空间,是连续的。这类问题,我们叫做Regression问题。最简单的线性回归就是一个典型的回归模型。

    除了分类和回归问题,在NLP领域中,还会用到一种机器学习问题:结构化学习。结构化学习的输出空间包含了某些结构在里面,它的一些解法通常使从多分类问题延伸而来,比较复杂。

    机器学习按照输出空间划分,可以分为二元分类、多元分类、回归、结构化学习等不同的类型。其中二元分类和回归是最基础,最核心的两个类型。


    图3.png

    二 、Learning with Different Data Label yn

    如果我们拿到的训练样本D既有输入特征x,也有输出yn,那么我们把这种类型的学习称为监督学习(Supervised Learning)。监督学习可以是二元分类、多元分类或者是回归,最重要的使知道输出标签yn。与监督学习相对于的是非监督学习。非监督学习是没有输出标签yn的,典型的非监督学习包括:聚类(clustering)问题,比如对网页上新闻的自动分类;密度估计,比如交通路况分析;异常检测,比如用户网络检测。通常情况下,非监督学习更复杂一些,而且非监督的问题很对都可以使用监督学习的一些算法思想来实现。

    图四

    介于监督和非监督学习之间叫做半监督学习(Semi—supervised Learning)。半监督学习就是说一部分数据由输出标签yn,而另外一部分数据没有输出标签yn。在设计运用中,半监督学习有时候是必须的。比如医药公司对某些药物进行检测,考虑到成本和实验人群限制等问题,只有一部分数据由输出标签yn。

    监督、非监督和半监督学习是机器学习领域三个主要类型。除此之外,还有一种非常重要的类型:增强学习(Reinforcement Learining)。增强学习中,我们给模型或系统一些输出,但是给不了我们希望的真实的输出y,根据模型的输出反馈,如果反馈结果良好,更接近真实输出,就给其正向奖励,如果反馈结果不好,偏离真实输出,就给其方向激励。不断通过”反馈—修正“这种形式,一步一步让模型学习的更好,这就是增强学习的核心所在。增强学习可以类比成训练宠物的过程,比如我们要训练狗狗坐下,但是狗狗无法直接听懂我们的指令。在训练过程中,我们给狗狗示意,如果表现好,我们就给它吃饼干。如果做与指令无关的动作,我们就给它惩罚。这样不断修正狗狗的动作,最终能让他按照我们的指令来行动。实际生活中,增强学习的例子也很多。比如根据用户信息、用户点击和选择来不断优化改进我们的线上广告投放系统。

    简单总结一下,机器学习按照数据输出标签yn划分成:监督学习、非监督学习、半监督学习和增强学习。其中,监督学习应用最为广泛,

    图5

    本文所应用图片来自 Coursear的《Machine Learning Foundation》课程

    相关文章

      网友评论

          本文标题:《Machine Learning Foundation》读书笔

          本文链接:https://www.haomeiwen.com/subject/etbzjqtx.html