《机器学习》西瓜书学习笔记（七）

《机器学习》西瓜书学习笔记（七）

作者: hmta_dhs | 来源:发表于2017-10-30 15:31 被阅读0次

《机器学习》西瓜书学习笔记（索引）
《机器学习》西瓜书学习笔记（八）
《机器学习》西瓜书学习笔记（七）
《机器学习》西瓜书学习笔记（五）
《西瓜书笔记》（1）机器学习概述
机器学习入门 | 西瓜书笔记（一）
机器学习笔记-文本分类（一）概述
神经网络--资料篇
一起学习机器学习（1）：基本概念
《机器学习》西瓜书学习笔记（六）

上一篇笔记在这里：《机器学习》西瓜书学习笔记（六）

第十章降维与度量学习

10.1 k近邻学习

k近邻（k-Nearest Neighbor，kNN）学习是一种常用的监督学习方法，其工作机制非常简单：找离测试样本“最近”的k个训练样本，然后基于k个“邻居”的信息来进行观测。通常，在分类任务使用“投票法”，在回归任务使用“平均法”。
k近邻学习是懒惰学习（lazy learning）——在训练时仅仅保存样本，待收到测试样本后在进行处理；相应的，在训练阶段就对样本进行学习处理的方法称为急切学习（eager learning）。
给定测试样本x，其最近样本z，则最近邻分类器出错的概率就是x与z不同的概率，即

假设样本独立同分布，且对任意x和任意小正数δ，在x附近δ距离范围内总能找到一个训练样本z.令c=argmax_c∈YP(c|x*)表示贝叶斯最优分类器的结果，有

也就是说，最近邻分类器的泛化错误率不超过贝叶斯最优分类器的2倍。

10.2 低维嵌入

上一节的讨论基于一个前提：任意x和任意小正数δ，在x附近δ距离范围内总能找到一个训练样本，即训练样本密度足够大。在归一化d维空间内需要(1/δ)^d，而d往往非常大，于是所需的样本数是天文数字，样本不够学不了，称为“维数灾难”（curse of dimensionality），所以我们需要降维。
在很多时候，虽然数据是高维的，但是与学习任务有关的只有低维，即高维空间的一个低维“嵌入”

多维缩放（Multiple Dimensional Scaling）：
假定m个样本在原始空间的距离矩阵为D∈R^m×m，其第i行j列的元素dist_ij为样本x_i到x_j的距离。我们的目标是获取样本在d'维空间的表示Z∈R^d'×m，d'<=d，且||z_i-z_j||=dist_ij
令B=Z^TZ∈R^m×m，其中B为降维后样本的内积矩阵，b_ij=z_i^Tz_j，有

为便于讨论，令Σ_i=1^mz_i=0，这样的话B的行的和与列的和均为0.即Σ_i=1^mb_ij=Σ_j=1^mb_ij=0，易知

其中tr是矩阵的迹（trace)，tr(B)=Σ_i=1^m||z_i||²。令

由以上式子可得

10.3 主成分分析（Principal Component Analysis，PCA）

对于一个高维正交空间，找到一个超平面，最好满足：

最近重构性：样本点到这个超平面的距离足够近。
最大可分性：样本点在这个超平面上的投影能尽可能分开。

10.4 核化线性降维

高维到低维的映射是非线性的时候就需要核化线性降维。
举例：KPCA（详见教材）

10.5 流形学习

10.5.1 等度量映射

等度量映射（Isometric Mapping，简称Isomap）认为低维流形嵌入到高维空间之后，直接在高维空间中计算直线距离具有误导性。

（注：MDS详见第二节）

10.5.2 局部线性嵌入

与Isomap试图保证近邻样本之间的距离不同，局部线性嵌入（Locally Linear Embedding，简称LLE）试图保持邻域内样本之间的线性关系。

10.6 度量学习

举例：近邻成分分析

下一篇：《机器学习》西瓜书学习笔记（八）

相关文章

《机器学习》西瓜书学习笔记（索引）
第一章，第二章：《机器学习》西瓜书学习笔记（一）第三章：《机器学习》西瓜书学习笔记（二）第四章，第五章：《机器...
《机器学习》西瓜书学习笔记（八）
上一篇笔记在这里：《机器学习》西瓜书学习笔记（七）第十一章特征选择与稀疏学习 11.1 子集搜索与评价相关特...
《机器学习》西瓜书学习笔记（七）
上一篇笔记在这里：《机器学习》西瓜书学习笔记（六）第十章降维与度量学习 10.1 k近邻学习 k近邻（k-Ne...
《机器学习》西瓜书学习笔记（五）
上一篇笔记在这里：《机器学习》西瓜书学习笔记（四）第七章贝叶斯分类器 7.1 贝叶斯分类器假设有N种可能的类...
《西瓜书笔记》（1）机器学习概述
《西瓜书》指的是周志华老师的《机器学习》著作什么是机器学习？机器学习致力于通过计算的手段，利用经验来改善系统自...
机器学习入门 | 西瓜书笔记（一）
前言我是一个机器学习的入门者。看了很多前辈大神的推荐，从西瓜书（周志华老师《机器学习》）或者 Coursera ...
机器学习笔记-文本分类（一）概述
最近在看机器学习的书籍和视频，主要有：统计学习方法李航西瓜书周志华python机器学习实战机器学习算法原理与...
神经网络--资料篇
实验室学长给的意见是先学习机器学习，再学习深度学习。资料列表： 1.西瓜书《机器学习》（周志华著）+AI圣经《D...
一起学习机器学习（1）：基本概念
相信每一位学习机器学习的同学都或多或少的听说过周志华老师的《机器学习》一书。其由于封面上的西瓜以及在书中以西瓜的引...
《机器学习》西瓜书学习笔记（六）
上一篇笔记在这里：《机器学习》西瓜书学习笔记（五）第九章聚类 9.1 聚类任务无监督学习（unsupervi...

网友评论

本文标题：《机器学习》西瓜书学习笔记（七）

本文链接：https://www.haomeiwen.com/subject/xeqkpxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|《机器学习》西瓜书学习笔记（七）|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！