美文网首页
几个概念

几个概念

作者: WM8 | 来源:发表于2017-04-15 10:08 被阅读0次


  机器学习是什么?简单地讲,机器学习是给定输入x,通过模型的训练获取所需的输出y,也即训练出函数y(x)

  训练集:⼀个由N个特征{x1, …, xN }组成的集合,⽤来调节模型的参数(打个比方说,可以当做上学时平时的作业,从中可以学习到知识)

  测试集:用来检验模型效果的特征集(平时的期末考,由于不讲解试卷,所以只知道成绩不知道错误在哪里,无法从中获取知识)

  泛化:正确分类与训练集不同的新样本的能力(将某个知识点从一个题目迁移到另一个题目的能力)

  过拟合:模型在训练集上效果很好,在测试集中却表现不佳,其主要原因就是过拟合,泛化性能降低。过拟合是机器学习很经常遇见的情况,可以用L1、L2正则化、drought等方法解决。(考试过拟合现象:看过的都没考,不按历年题目的套路出卷,不是因为看了假书上了假课做了假题,只是对往年试题过拟合)

过拟合图像(图片来自莫烦python)

  欠拟合:对训练样本的一般性质还没学好

  预处理:将原始输⼊向量变换到新的变量空间,使得在新的变量空间中模式识别问题可以更容易地被解决。我的理解是可能由于特征维度过高,包含过多无用信息,所以进行降维或特征抽取。这样也可以加快计算速度,提高模型准确性。

监督学习:训练数据的样本包含输⼊向量以及对应的⽬标向量(或者叫标签)。比如数字识别问题中,既具有输入的图片信息,也具有图片所对应的标签(0-9)。像数字识别这样,将每个输⼊向量分配到有限数量离散标签中的⼀个,被称为分类问题;如果要求的输出由⼀个或者多个连续变量组成,那么这个任务被称为回归。回归问题的⼀个例⼦是房价预测。在这个问题中,输⼊可以是年份、年平均收入等。

分类/回归(图片来自https://www.zhihu.com/question/21329754)

无监督学习:训练数据由⼀组输⼊向量x组成,没有任何对应的⽬标值。目的可能是发现数据中相似样本的分组,这被称为聚类;或者决定输⼊空间中数据的分布,这被称为密度估计,或者把数据从⾼维空间投影到⼆维或者三维空间,为了数据可视化。

相关文章

  • 《几个概念》

    板砖声明 本文手犮于简书:校长杨羊 无需转载即可授权 你也是闲的来看羊写字... ... 一、年回报率 1、 支付...

  • 几个概念

    1.机会成本 机会成本是指为了得到某样东西,而要放弃的其他机会可能产生的其他价值。机会成本这个概念很好理解...

  • 几个概念

    科学是什么,我现在回答不了。但是传统的中国没有科学,中医到中国天文都不是科学 西方的七艺是语文三艺,文法,修辞,逻...

  • 几个概念

    机器学习是什么?简单地讲,机器学习是给定输入x,通过模型的训练获取所需的输出y,也即训练出函数y(x) 训练集...

  • 几个概念

    这几天看社会心理学,琢磨了几个概念,特复习一下。 关于自尊和自我效能的区别:自尊是指你由衷喜欢你自己,自我效能是指...

  • 几个概念

    1.东数西算 “东数西算”是把东部密集的算力需求有序引导到西部,使数据要素跨域流动。打通“数”动脉,织就全国算力一...

  • 几个概念名词

    边际递减效应 预期心理收益

  • 并发几个概念

    1.同步与异步 2.并发和并行 3.临界区 4.阻塞和非阻塞 5.死锁、饥饿、活锁 6.并发级别 6.1阻塞 6....

  • 几个商业概念

    【供需理论】 概念:商品经济社会,一切商品皆有价值,人们依据商品价值定义了商品价格。有商品,便存在生产者和消费者,...

  • 几个知识概念

    为了做组内分享,我决定好好做功课,把知识的定义,知识的分类,知识的特征,信息与知识的区别弄清楚。不查不要紧,一查才...

网友评论

      本文标题:几个概念

      本文链接:https://www.haomeiwen.com/subject/jmknattx.html