【机器学习1】 k-近邻算法(kNN)—电影分类

【机器学习1】 k-近邻算法(kNN)—电影分类

作者: 王小野 | 来源:发表于2020-05-27 00:31 被阅读0次

【机器学习实战】第2章 k-近邻算法（KNN）
机器学习实战(MACHINE LEARNING IN ACTIO
机器学习之初识KNN算法——针对泰坦尼克号生存记录建模的两种方法
二：K近邻
【机器学习1】 k-近邻算法(kNN)—电影分类
k-近邻算法
学习笔记——机器学习（七）
机器学习实战笔记 1）K-近邻算法:理论篇
机器学习实战之K-近邻算法（二）
K-近邻

k近邻法(k-nearest neighbor, k-NN)

原理：

存在一个样本数据集合，也称作训练样本集，并且样本集中每个数据都存在标签，即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后，将新数据的每个特征与样本集中数据对应的特征进行比较，然后算法提取样本集中特征最相似数据（最近邻）的分类标签。一般来说，我们只选择样本数据集中前k个最相似的数据，这就是k-近邻算法中k的出处，通常k是不大于20的整数。最后，选择k个最相似数据中出现次数最多的分类，作为新数据的分类。

优缺点：

优点：精度高、对异常值不敏感、无数据输入假定。

缺点：计算复杂度高、空间复杂度高。

适用范围：数值型和标称型。

Python实践案例：电影类型分类

已知：一些未看过电影的打斗镜头数、接吻镜头数、电影所属类型的标签

求：确定电影类型是爱情片还是动作片

训练集-样本电影示例

步骤：

1、计算已知类别数据集中的点与当前点之间的距离；

2、按照距离递增次序排序；

3、选取与当前点距离最小的k个点；

4、确定前k个点所在类别的出现频率；

5、返回前k个点所出现频率最高的类别作为当前点的预测分类。

具体如下：

计算未知电影与样本集中所有电影距离。

计算红点到每个黄点（已知电影）的距离，按距离递增排序，假设k=3，则表示按照前3个距离最近的电影类型出现的最高频率（比如动作片出现的频率为2/3）作为判定未知电影类型的标准和依据(即红点-未知电影为动作片)，如下：

计算距离示例

代码：

1）准备数据：

代码

结果

2）kNN 算法预测数据：

代码

结果

学习来源：《机器学习实战》　[美] Peter Harrington

Jack Cui 博文https://cuijiahua.com/

相关文章

【机器学习实战】第2章 k-近邻算法（KNN）
第2章 k-近邻算法 KNN 概述 k-近邻（kNN, k-NearestNeighbor）算法主要是用来进行分类...
机器学习实战(MACHINE LEARNING IN ACTIO
kNN(k近邻)方法在《机器学习实战》这本书里是最先介绍的算法，估计也是最简单的了。。。k-近邻算法(kNN)工作...
机器学习之初识KNN算法——针对泰坦尼克号生存记录建模的两种方法
KNN算法原理本篇博客基于《机器学习实战》实现算法原理简要概括，重在代码实现 k-近邻算法(kNN)的工作原理是...
二：K近邻
简介 K近邻算法，或者说K最近邻(kNN，k- NearestNeighbor)分类算法是数据挖掘分...
【机器学习1】 k-近邻算法(kNN)—电影分类
k近邻法(k-nearest neighbor, k-NN) 原理：存在一个样本数据集合，也称作训练样本集，并且...
k-近邻算法
1 k-近邻算法概述 k-近邻算法采用测量不同特征值之间的距离方法进行分类。 KNN是通过测量不同特征值之间的距离...
学习笔记——机器学习（七）
申明一下，只是学习笔记，只是学习笔记，只是学习笔记。 K-近邻算法（又叫knn算法）第一点——用途：1.解决分类...
机器学习实战笔记 1）K-近邻算法:理论篇
近邻算法K-近邻算法是机器学习分类算法中最简单的方法之一。在讲清楚K-近邻算法之前，我们先来看看它的一个简化版--...
机器学习实战之K-近邻算法（二）
机器学习实战之K-近邻算法（二） 2-1 K-近邻算法概述简单的说，K-近邻算法采用测量不同特征值之间的距离方法...
K-近邻
K-近邻算法，(kNN，k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最...

网友评论

本文标题：【机器学习1】 k-近邻算法(kNN)—电影分类

本文链接：https://www.haomeiwen.com/subject/otciahtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|【机器学习1】 k-近邻算法(kNN)—电影分类|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！