2020-01-20

作者: 数据小黑升值记 | 来源:发表于2020-01-21 18:57 被阅读0次

RIdeogram: drawing SVG graphics
渺小的我们着急变大一生挣扎！mysore生日party原来如此！
2020-01-21
生涯咨询复盘
虚拟机里github无法访问之解决
关注解决
《科幻小说写作资料汇总》2020-01-20更新《描写与背景》
2020-01-22
2020-01-20
设报设计分享 | 干货！和无图可找再见吧！

最开始，让我们导入下列东西并为 Matplotlib 设置一个样式。

import numpy as np
import matplotlib.pyplot as plt
from matplotlib import style
import warnings
from math import sqrt
from collections import Counter
style.use('fivethirtyeight')

我们打算使用警告来避免使用比分组数量更低的 K 值，至少是最开始（因为我会展示一个更加高效的方法），之后对集合计数来获取出现次数最多的分类。

下面，我们创建一些数据：

dataset = {'k':[[1,2],[2,3],[3,1]], 'r':[[6,5],[7,7],[8,6]]}
new_features = [5,7]

这个数据集只是个 Python 字典，键是点的颜色（将这些看做分类），值是属于这个分类的数据点。如果你回忆我们的乳腺肿瘤数据集，分类都是数字，通常 Sklearn 只能处理数字。例如，向量翻译为任意数字2，而恶性翻译为任意数字4，而不是一个字符串。这是因为，Sklearn 只能使用数字，但是你并不一定要使用数字来代表分类。下面，我们创建简单的数据集5, 7，用于测试。我们可以这样来快速绘图：

[[plt.scatter(ii[0],ii[1],s=100,color=i) for ii in dataset[i]] for i in dataset]
plt.scatter(new_features[0], new_features[1], s=100)

plt.show()

[[plt.scatter(ii[0],ii[1],s=100,color=i) for ii in dataset[i]] for i in dataset]这一行和下面这个相同：

for i in dataset:
    for ii in dataset[i]:
        plt.scatter(ii[0],ii[1],s=100,color=i)

你可以看到红色和黑色的明显分组，并且我们还有蓝色的点，它是new_features，我们打算对其分类。

我们拥有了数据，现在我们打算创建一些函数，来分类数据。

def k_nearest_neighbors(data, predict, k=3):

    return vote_result

这就是我们的框架，从这里开始。我们想要一个函数，它接受要训练的数据，预测的数据，和 K 值，它的默认值为 3。

下面，我们会开始填充函数，首先是一个简单的警告：

def k_nearest_neighbors(data, predict, k=3):
    if len(data) >= k:
        warnings.warn('K is set to a value less than total voting groups!')

    return vote_result

如果选取的最近邻的数量小于或等于分类数量，那么就给出警告（因为这样会产生偏差）。

现在，如何寻找最近的三个点呢？是否有一些用于搜索的魔法呢？没有，如果有的话，也是很复杂而。为什么呢？KNN 的工作原理是，我们需要将问题中的数据与之前的数据比较，之后才能知道最近的点是什么。因此，如果你的数据越多，KNN 就越慢。我们这里告一段落，但是要考虑是否有方法来加速这个过程。

网友评论

本文标题：2020-01-20

本文链接：https://www.haomeiwen.com/subject/gmlszctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

2020-01-20

相关文章

RIdeogram: drawing SVG graphics

渺小的我们着急变大一生挣扎！mysore生日party原来如此！

2020-01-21

生涯咨询复盘

虚拟机里github无法访问之解决

关注解决

《科幻小说写作资料汇总》2020-01-20更新《描写与背景》

2020-01-22

2020-01-20

设报设计分享 | 干货！和无图可找再见吧！

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读