一、算法概述:
一个样本集,数据都有标签,测试集中的特征和样本级做对比,取样本集中最相似的前k个的标签作为测试集的标签。
二、数学计算:
特征标准化后,计算特征的距离:
d= sqrt ((xa0 - xb0)^2 + (xa1 - xb1)^2)
三、伪代码:
(1)计算已知类别点与当前点之间的距离
(2)按照距离排序
(3)选取与当前点距离最小的k个点
(4)选取前k个点所在类别的出现频率
(5)输出出现频率最大的类别
一、算法概述:
一个样本集,数据都有标签,测试集中的特征和样本级做对比,取样本集中最相似的前k个的标签作为测试集的标签。
二、数学计算:
特征标准化后,计算特征的距离:
d= sqrt ((xa0 - xb0)^2 + (xa1 - xb1)^2)
三、伪代码:
(1)计算已知类别点与当前点之间的距离
(2)按照距离排序
(3)选取与当前点距离最小的k个点
(4)选取前k个点所在类别的出现频率
(5)输出出现频率最大的类别
本文标题:KNN
本文链接:https://www.haomeiwen.com/subject/onbiettx.html
网友评论