美文网首页
机器学习基本知识

机器学习基本知识

作者: Zake_Wang | 来源:发表于2018-03-02 14:48 被阅读0次
机器学习分类
  • 按有无监督分类
    1.全监督学习:回归算法,朴素贝叶斯,SVM(支持向量机)
    2.无监督学习:聚类算法,降维算法
    3.半监督学习
  • 是否应用了神经网络
    1.传统机器学习
    2.应用了深度神经网络,深度学习
监督学习与无监督学习
监督学习

1.用于训练模型的数据有标注
2.需要收集或雇佣标注者
3.数据相对较少
4.相关算法多,效果好
算法包括了:分类算法(Logistic Regression、Neutral Network、Naive Bayes、KNN、Decision Tree等),回归算法(Linear Regression),集成算法(Bagging、Boosting)

无监督学习

1.训练模型的数据没有标注
2.数据很多
3.相关算法少
4.研究前沿
算法包括了:聚类算法(K-means),降维算法(SVD)

基本概念和术语
  • 训练数据
  • 模型参数
第0轮:0.8*像素0+0.1*像素1>0: 猫
 狗
...
第1轮:0.75*像素0+0.2*像素1>0: 猫 
参数: (𝛼1,𝛼2)
  • 测试数据
    此类数据的标注在训练时候不可见
  • 测试指标
    错误率,正确率
  • 损失函数Loss Function
    1.一个关于参数的数学函数f(𝛼1,𝛼2)
    2.损失函数f可以近似地表示错误率,即f值越大,错误率近似越大
    3.好处,f可以求关于每个参数的导数,即可以用到梯度下降法
    4.这样使得模型不用猜和试参数,而是有规律地逐渐找到更好的参数
    关于损失函数总结:根据训练数据调整参数,依据梯度下降法,找到损失函数,不断求导,沿导数方向的反方向一直走,找到一个合适的点,然后优化,防止过拟合。
  • 推广能力
    1.机器学习模型最重要的功能就是它的推广能力
    2.在训练过程中,模型只能见到训练数据。不断优化,使得在训练数据上的指标越来越好,错误率越来越低,但是我们真正关心的是一个它没有见过的数据,错误率怎么样,即推广能力Generalization如何
    3.模型在训练数据上错误率越小 不等于 推广能力越强,根本原因是:参数已经被优化成为只能在训练数据上表现良好,推广能力很差。
机器学习的基本架构
架构.png
如何选择机器学习的模型model
  • 根据输入数据
    1.有标注:监督学习
    2.无标注:无监督学习
  • 根据输出数据
    1.纯数字:回归模型
    2.类别:分类模型
  • 根据数据规模
    1.数据多:可以选择参数较多的模型(例如深度学习)
    2.数据少:选择参数少的较简单 模型(比如线性回归)
  • 根据实际效果
    1.选择推广能力最好的模型
    2.有时需要在效果、模型复杂性、时间空间限制之间寻找平衡

相关文章

  • 机器学习算法的基本知识(使用Python和R代码)

    机器学习算法的基本知识(使用Python和R代码) 机器学习算法的基本知识(使用Python和R代码)

  • 花书第五章笔记

    [TOC] 第五章 机器学习基础 机器学习基础 掌握机器学习的基本知识和基础原理 机器学习基础[p87-p142]...

  • 读《机器学习极简入门》

    这几天完成了阅读《机器学习极简入门》。 以前做过机器学习的python测试,但是对于其中的基本知识很是模糊,经...

  • 机器学习基本知识

    机器学习分类 按有无监督分类1.全监督学习:回归算法,朴素贝叶斯,SVM(支持向量机)2.无监督学习:聚类算法,降...

  • 增强学习资源

    增强学习是机器学习的一个重要分支。 如果您已经具备机器学习、深度学习的基本知识,可以直接上手增强学习,这里推荐UC...

  • 周志华著《机器学习》读书笔记0.1

    本笔记为学习周志华著《机器学习》过程中的笔记,用以辅助学习。全书分三个部分: 机器学习基本知识(1~3章) 经典常...

  • 每日一读 12.12

    机器学习入门基本知识:白话基本概念 http://www.aboutyun.com/thread-23498-1-...

  • 根据需求选择算法

    第0步:基本知识 三个主要的机器学习分类: 监督学习(supervised learning):每个数据点被标记或...

  • data mining-输出:知识的表达

    机器学习方法的基本知识表达形式是以决策树或者规则来展现,知识是用来描绘由机器学习方法产生的结构。 表 采用与输入方...

  • 使用python机器学习六(scikit-learn实战)

    上一篇《使用python机器学习(五)-scikit-learn》简单介绍了scikit-learn的基本知识,此...

网友评论

      本文标题:机器学习基本知识

      本文链接:https://www.haomeiwen.com/subject/agdaxftx.html