美文网首页
机器学习基础 learning note

机器学习基础 learning note

作者: 阿卜儿 | 来源:发表于2017-11-19 21:27 被阅读0次

    1.《西瓜书》南京大学 周志华教授

    2.机器学习竞赛网站

    kaggle.com

    机器学习基础 learning note

    3.by朱松纯,UCLA

    机器学习基础 learning note

    4.书籍推荐

    机器学习基础 learning note 机器学习基础 learning note 机器学习基础 learning note 机器学习基础 learning note

    5.基本术语

    那个算法更好(NFL定理)

    6.

    机器学习基础 learning note

    7.特征提取(feature extraction)

    机器学习往往依靠于

    8.模型评估和选择

    unseen instance

    9.过拟合 (overfitting)vs欠拟合(underfitting)

    10.模型选择(model selection)

    评估方法

    (1)常用方法:

    留出法:①保持数据分布一致

    ②k折交叉验证

    ③自动法

    机器学习基础 learning note

    (2)“调参”与最终模型

    (3)性度能量

    (4)查准率vs查全率

    p=tp/(tp+fp)

    R=TP/(tp+fn)

    (5)PR图 ,BEP(Break event point)

    (6)ROC  AUC

    10.线性模型

    分类  回归

    11.线性回归

    12.逻辑回归  对数几率回归(西瓜书)

    13.对率回归如何求解

    14.梯度下降

    二:扩展到多类

    1.类别不平衡问题

    :过采样

    :欠采样

    :阈值移动

    2.决策树(基于树结构的分类器)

    3.决策树模型:(策略:分而治之)

    自根至叶,递归过程

    4.划分方法:(1)信息增益

    信息熵的定义:

    信息增益,划分成v个分支

    (2)基尼系数

    5.支持向增量

    线性分类器回顾

    间隔(margin)和支持向量(support vector)

    机器学习基础 learning note

    6.最大间隔

    7.Nonlinear SVMS

    做一个映射从而核函数

    8.常用核函数

    机器学习基础 learning note

    9.软间隔(soft margin)

    10.正则化(regularization)

    11.聚类clustering

    无监督学习中,研究最多应用最广

    如何聚类?基本思想:数据样本分为多个不相交的簇

    簇内相似度高,簇间相似度低

    12.距离计算

    13.度量学习(metric learning)

    14.k均值聚类算法(k-means)

    k-means:design chioces

    How to choose the number of clusters?

    k-mesns pros and cons

    15.Spectral clustering

    机器学习基础 learning note

    三:降维和度量分析

    K近邻分类器

    :实际运用中很难找到足够准确的近邻――维数灾难

    降维

    主成分分析

    :最大重构性

    :最大可分性

    流形学习

    局部线性嵌入

    马氏距离

    :欧式距离的缺陷:各向同性

    度量学习和视觉跟踪

    从度量学习到表示学习

    机器学习基础 learning note

         

         

    相关文章

      网友评论

          本文标题:机器学习基础 learning note

          本文链接:https://www.haomeiwen.com/subject/mqnpvxtx.html