k近邻算法

k近邻算法

作者: 乔治大叔 | 来源:发表于2019-10-10 15:55 被阅读0次

“k 近邻算法”综述
k 近邻法
十大经典算法（五）
二：K近邻
最“懒惰”的kNN分类算法
k近邻算法
《算法图解》note 10 K近邻算法
【机器学习实战】第2章 k-近邻算法（KNN）
机器学习实战之K-近邻算法（二）
K近邻

k近邻算法简介

k近邻算法(k-nearest neighbor, k-NN)是1967年由Cover T和Hart P提出的一种基本分类与回归方法。它的工作原理是：存在一个样本数据集合，也称作为训练样本集，并且样本集中每个数据都存在标签，即我们知道样本集中每一个数据与所属分类的对应关系。输入没有标签的新数据后，将新的数据的每个特征与样本集中数据对应的特征进行比较，然后算法提取样本最相似数据(最近邻)的分类标签。一般来说，我们只选择样本数据集中前k个最相似的数据，这就是k-近邻算法中k的出处，通常k是不大于20的整数。最后，选择k个最相似数据中出现次数最多的分类，作为新数据的分类。

k-近邻算法（kNN）工作原理：

存在一个样本集，该样本集中的每条数据都有标记。
输入没有标记的新数据，对新数据的每个特征都与样本集中数据对应特征比较。
通过算法提取样本集中最相似（最近邻）的分类标记。一般我们只选择样本集中前 k 个最相似的数据，这就是 k-近邻算法中 k 的出处，通常 k 是不大于20的整数。
选择 k 个最相似数据中出现次数最多的分类，作为新数据的分类。

k-近邻算法（kNN）实例

举个简单的例子，我们可以使用k-近邻算法分类一个电影是爱情片还是动作片。

KNN.png

我们已有的数据集合，也就是训练样本集。这个数据集有两个特征，即打斗镜头数和接吻镜头数。除此之外，我们也知道每个电影的所属类型，即分类标签。用肉眼粗略地观察，接吻镜头多的，是爱情片。打斗镜头多的，是动作片。以我们多年的看片经验，这个分类还算合理。如果现在给我一部电影，你告诉我这个电影打斗镜头数和接吻镜头数。不告诉我这个电影类型，我可以根据你给我的信息进行判断，这个电影是属于爱情片还是动作片。而k-近邻算法也可以像我们人一样做到这一点，不同的地方在于，我们的经验更"牛逼"，而k-近邻算法是靠已有的数据。

KNN2.png

电影例子中的特征是2维的，这样的距离度量可以用两点距离公式计算，但是如果是更高维的呢？对，没错。我们可以用欧氏距离(也称欧几里德度量)，如图所示。我们高中所学的两点距离公式就是欧氏距离在二维空间上的公式，也就是欧氏距离的n的值为2的情况。

欧式距公式.jpg

k-近邻算法步骤：

计算已知类别数据集中的点与当前点之间的距离；
按照距离递增次序排序；
选取与当前点距离最小的k个点；
确定前k个点所在类别的出现频率；
返回前k个点所出现频率最高的类别作为当前点的预测分类。

总结

我们已经使用 k-近邻算法构造了一个分类器分类的概念是在已有数据的基础上学会一个分类函数或构造出一个分类模型，即分类器。分类器并不会得到百分百正确的结果，我们可以使用多种方法检测分类器的正确率。此外分类器的性能也会受到多种因素的影响，如分类器设置和数据集等。

通过大量的测试数据，我们可以得到分类器的错误率-分类器给出错误结果的次数除以测试执行的总数。错误率是常用的评估方法，主要用于评估分类器在某个数据集上的执行效果。完美分类器的错误率为0，最差分类器的错误率是1.0。

同时，我们也不难发现，k-近邻算法没有进行数据的训练，直接使用未知的数据与已知的数据进行比较，得到结果。因此，可以说k-近邻算法不具有显式的学习过程。

相关文章

“k 近邻算法”综述
“k 近邻算法”综述本来题目想叫“白话 k 近邻算法”，后来想想，“k 近邻算法” 的描述几乎就是“白话”，所以...
k 近邻法
k 近邻法 k 近邻算法 k 近邻模型 k 近邻法的实现：kd 树搜索 kd 树 k 近邻模型实现 k 近邻模型...
十大经典算法（五）
六、KNN(K Nearest Neighbor) K近邻（有监督） KNN算法，即K近邻算法是一种监督学习算法，...
二：K近邻
简介 K近邻算法，或者说K最近邻(kNN，k- NearestNeighbor)分类算法是数据挖掘分...
最“懒惰”的kNN分类算法
1. K-近邻算法#### k-近邻算法（k Nearest Neighbor），是最基本的分类算法，其基本思想是...
k近邻算法
k近邻算法简介 k近邻算法(k-nearest neighbor, k-NN)是1967年由Cover T和Har...
《算法图解》note 10 K近邻算法
这是《算法图解》第十篇读书笔记，内容主要是K邻近算法的介绍。 1.K近邻算法简介 K近邻算法（K-nearest ...
【机器学习实战】第2章 k-近邻算法（KNN）
第2章 k-近邻算法 KNN 概述 k-近邻（kNN, k-NearestNeighbor）算法主要是用来进行分类...
机器学习实战之K-近邻算法（二）
机器学习实战之K-近邻算法（二） 2-1 K-近邻算法概述简单的说，K-近邻算法采用测量不同特征值之间的距离方法...
K近邻
一、模型 1.1概念 k-近邻算法是一种基本分类与回归方法，我们这里只讨论分类问题中的 k-近邻算法。k-近邻算法...

网友评论

机器学习

本文标题：k近邻算法

本文链接：https://www.haomeiwen.com/subject/twcapctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

机器学习

关于我们|服务条款|联系我们|k近邻算法|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！