最“懒惰”的kNN分类算法

作者: 程sir | 来源:发表于2016-06-24 09:45 被阅读684次

机器学习：KNN（K 近邻）分类算法
最“懒惰”的kNN分类算法
深入浅出KNN算法（一）介绍篇
机器学习笔记汇总
大数据算法：分类算法
KNN与K-Means算法的区别
100天机器学习实践之第7天
knn算法
KNN算法：K最近邻分类算法(K-NearestNeighbor
利用Python进行数字识别

1. K-近邻算法####

k-近邻算法（k Nearest Neighbor），是最基本的分类算法，其基本思想是采用测量不同特征值之间的距离方法进行分类。

2. 算法原理####

存在一个样本数据集合（训练集），并且样本集中每个数据都存在标签（即每一数据与所属分类的关系已知）。输入没有标签的新数据后，将新数据的每个特征与样本集中数据对应的特征进行比较（计算距离），然后提取样本集中特征最相似数据（最近邻）的分类标签。一般会取前k个最相似的数据，然后取k个最相似数据中出现次数最多的标签（分类）最后新数据的分类。
因此，这是一个很“懒惰”的算法，所谓的训练数据并没有形成一个“模型”，而是一个新的数据需要分类了，去和所有训练数据逐一比较，最终给出分类。这个特征导致在数据量较大时，性能很差劲。

3. 算法过程####

对未知类别属性的数据集中的每个点依次执行以下操作：
1）计算已知类别数据集中的点与当前点之间的距离（欧式距离、曼哈顿距离或者余弦夹角等各种距离算法，具体情况具体分析用哪种）；
2）按照距离递增次序排序；
3）选取与当前点距离最小的k个点；
4）确定前k个点所在类别的出现频率；
5）返回前k个点出现频率最高的类别作为当前点的预测分类。

欧氏距离计算：

二维平面上两点A(x1,y1)与B(x2,y2)间的欧氏距离：
　　
三维空间两点A(x1,y1,z1)与B(x2,y2,z2)间的欧氏距离：
　　
n维空间两点的欧式距离以此类推

4. 计算案例####

我还是瞎编一个案例，下表有11个同学的小学成绩和12年后读的大学的情况，现在已知“卫”同学的小学成绩了，可以根据kNN来预测未来读啥大学。

逐一计算各位同学与卫同学的距离，然后我们选定3位（即这里的k=3）最为接近的同学，推测卫同学最终的大学

3位同学中2个清华，1个北邮，所以卫同学很有可能在12年后上清华。

5. 算法要点####

1） K的选择，一般不超过训练集数量的平方根
2）距离更近的近邻也许更应该决定最终的分类，所以可以对于K个近邻根据距离的大小设置权重，结果会更有说服力
3）如果采用欧氏距离计算，不同变量间的值域差距较大时，需要进行标准化，否则值域较大的变量将成为最终分类的唯一决定因素

机器学习：KNN（K 近邻）分类算法
kNN 算法不需要经过算法训练，属于懒惰学习，需要训练的属于急切学习kNN 是最简单的分类算法优点：精度高、对异...
最“懒惰”的kNN分类算法
1. K-近邻算法#### k-近邻算法（k Nearest Neighbor），是最基本的分类算法，其基本思想是...
深入浅出KNN算法（一）介绍篇
一.KNN算法概述 KNN可以说是最简单的分类算法之一，同时，它也是最常用的分类算法之一，注意KNN算法是有监督学...
机器学习笔记汇总
kNN算法：K最近邻(kNN，k-NearestNeighbor)分类算法
大数据算法：分类算法
KNN分类算法 KNN算法，即K近邻（K Nearest Neighbour）算法，是一种基本的分类算法。其主要原...
KNN与K-Means算法的区别
内容参考：Kmeans算法与KNN算法的区别kNN与kMeans聚类算法的区别 KNN-近邻算法-分类算法思想：...
100天机器学习实践之第7天
K—近邻分类算法(KNN) KNN是什么？ K—近邻算法（简称KNN）是一种虽然简单但很常用的分类算法，也可用于回...
knn算法
knn算法 knn算法简介邻近算法，或者说K最近邻(kNN，k-NearestNeighbor)分类算法。所谓K...
KNN算法：K最近邻分类算法(K-NearestNeighbor
一、KNN算法概述最近邻算法，或者说K最近邻(KNN，K-NearestNeighbor)分类算法是数据挖掘分类...
利用Python进行数字识别
思路通过Python实现KNN算法。而KNN算法就是K最近邻(k-Nearest Neighbor，KNN)分类...

最“懒惰”的kNN分类算法

1. K-近邻算法####

2. 算法原理####

3. 算法过程####

4. 计算案例####

5. 算法要点####

相关文章

机器学习：KNN（K 近邻）分类算法

最“懒惰”的kNN分类算法

深入浅出KNN算法（一）介绍篇

机器学习笔记汇总

大数据算法：分类算法

KNN与K-Means算法的区别

100天机器学习实践之第7天

knn算法

KNN算法：K最近邻分类算法(K-NearestNeighbor

利用Python进行数字识别

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

机器学习算法

程序员

机器学习与模式识别

数据挖掘

算法

呆鸟的Python数据分析