KNN

作者: 张伟松 | 来源:发表于2017-12-18 12:06 被阅读38次

k近邻法:假设输入空间中每个点对应一个分类,可以依据训练数据,将输入空间进行区域划分,对于一个新的测试数据,K近邻法使用距离该测试实例点最近的k个训练数据,取训练数据中类别数最多的为该实例的类别,即在该区域内使用多数表决原则。

算法

给定训练数据集X 以{数据:类别}的形式展示,其中数据为N维实数空间的向量,对于目标数据M,有输入数据X,KNN模型将输入M所对应的类别。
换句话说,目标数据M的类别等同于在M附近的K个训练数据的类别中数量最大的。
极端的情况下,k=1, 即取M最近的1个数据的类别,作为该输入的类别;
另一种极端是 k=N,即取所有训练数据中类别最大的类,等同于没有做区域划分。
因此,考虑k值的选择,过小会导致模型过于复杂,易出现过度拟合,过大则造成模型精度不够,合适的k值可使用交叉验证的方法来确定。

kd树

  1. 首先构造根节点,根节点包含空间中所有的点;
  2. 选择一个超平面(X1的中位数)对1进行切割;
  3. 生成的两个区域lt为X1小于切分点的区域,rt为X1大于切分点的区域;
  4. 重复上述动作,直到子区域不能再划分。

搜索

使用kd树进行搜索的算法比较精妙,这里写不下就不写了。

相关文章

  • Spark --基于DataFrame API实现KNN算法

    Spark -- 基于DataFrame API实现KNN算法 KNN简介 KNN(k-Nearest Neigh...

  • KNN近邻算法总结

    目录 一、KNN近邻算法思想 二、KNN模型三大要素 三、KNN算法实现步骤 四、KNN算法的KD树实现 五、总结...

  • 利用Python进行数字识别

    思路 通过Python实现KNN算法。而KNN算法就是K最近邻(k-Nearest Neighbor,KNN)分类...

  • KNN

    KNN学习笔记 KNN is a classification algorithm which is instan...

  • 第六节分类算法

    1knn算法 1.1knn的过程 1.2scilit-learn中的knn 1.3scikit-learn机器学习...

  • knn算法

    knn算法 knn算法简介 邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法。所谓K...

  • 机器学习笔记汇总

    kNN算法:K最近邻(kNN,k-NearestNeighbor)分类算法

  • 01 KNN算法 - 概述

    KNN算法全称是K近邻算法 (K-nearst neighbors,KNN) KNN是一种基本的机器学习算法,所谓...

  • KNN算法-1-KNN简介

    KNN入门 1、KNN简介 kNN(k-NearestNeighbor),也就是k最近邻算法,这是一种有监督的学习...

  • KNN算法以及欧式距离

    1.KNN算法介绍 KNN 是什么? KNN(K-Nearest Neighbor)是最简单的机器学习算法之一,可...

网友评论

      本文标题:KNN

      本文链接:https://www.haomeiwen.com/subject/wbwpwxtx.html