美文网首页
CS229-3分类问题

CS229-3分类问题

作者: Aptitude | 来源:发表于2018-07-31 11:08 被阅读0次

分类问题

1. overfitting and underfitting

过拟合(overfitting):当学习器把训练样本学得“太好”了的时候,很可能已经把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质,这样会导致泛化性能下降,这种现象称为过拟合。

欠拟合(underfitting):对训练样本的一般性质尚未学好,这种现象称为欠拟合。

(图源《机器学习》)

2. Locally weighted regression

针对所有训练样例来说构造出一个线性模型不太现实,那么就可以对要预测的输入量附近的一些点训练出一个回归模型,这样也可以达到预测输出的目的,这个过程可以采用局部加权回归的方法。

在这里控制附近点的值是ω,若为输入量的附近的点时,ω接近于1,若离输入量比较远时,ω接近于0,如此起到了取附近的点训练回归模型的目的。

对ω中的τ进行一个说明:当τ比较大时,权值函数分布较广;

                                         当τ比较小时,权值函数分布集中。

3. The reason of using at least square model

推导出了J(θ)。

最小二乘法的目的:实际上是在假设误差项满足高斯分布,且独立同分布的情况下,是似然性最大化。

4. Classification

Using linearregression to solve classification problem is a bad idea.

Sigmoid function:

   以此引申到使用sigmoid函数解决{0,1}分类问题。

在这里推导出的θ表面上与回归算法中的相同,然而存在的重要差别是这里的输出值、实际值是离散的。

5. Perception algorithm

图源《机器学习》

感知机模型:将输入值直接映射为“0”或“1”。

相关文章

  • CS229-3分类问题

    分类问题 1. overfitting and underfitting 过拟合(overfitting):当学习...

  • 分类问题

    数据挖掘之分类模型 判别分析是在已知研究对象分成若干类型并已经取得各种类型的一批已知样本的观测数据,在此基础上根据...

  • 分类问题

    k 近邻分类法: 非线性地分类方法 1,怎么选择距离 2,在样本量大地时候计算量很大,3, k的选择(应该用交叉验...

  • 分类问题

    结果:KNN预测分类准确性: 0.7489581596932随机森林预测分类准确性: 0.765460910151...

  • 问题分类

    1,UCTS 问题 *UCTS 测试Fail 但环境不变的情况下手动测试PASS *辅助判定法:同样的环境,切换为...

  • np.argmax()

    分类问题 很多问题都可以转换为分类问题,情感分析大多是二分类:pos & neg ;NER 命名实体识别多分类问题...

  • 新闻分类:多分类问题

    多分类(multiclass classification):有多个类别;单标签、多分类(single-label...

  • 机器学习-二分类转多分类

    之前研究的分类算法比如SVM,LR等,解决的都是二分类问题,那如果问题用有多个类别呢?二分类问题转多分类问题,常用...

  • Machine Learning - Andrew Ng 笔记(

    分类问题(Classification) 首先什么是分类问题?分类问题就是预测的值是离散的,比如是否是垃圾邮件(是...

  • 条件随机场|机器学习推导系列(二十一)

    一、背景 概述 如上所示,分类问题分为硬分类和软分类两种。硬分类问题指的是分类结果非此即彼的模型,包括SVM、PL...

网友评论

      本文标题:CS229-3分类问题

      本文链接:https://www.haomeiwen.com/subject/tvycvftx.html