sklearn 中 make_blobs模块使用

作者: fred_33c7 | 来源:发表于2019-06-23 12:35 被阅读1次

sklearn 中 make_blobs模块使用
sklearn make_blobs 和numpy.random
bad input shape (125, 2)，拆分训练和测试
Python数据分析与机器学习30-SVM实例
Sklearn中的降维究竟是如何实现的
如何使用sklearn模块中的svm
机器学习笔记(1)-sklearn概况及API
数据预处理--sklearn preprocessing模块的使
数据集划分方法
Sklearn学习笔记（三）

最近在学习K-means算法。如果自己想写一个K-means算法的话，需要造数据集，这个时候，用sklearn中的make_blobs模块就很有用。
官方API说明
输入和输出：

输入和输出
翻译如下：

n_samples是待生成的样本的总数。
n_features是每个样本的特征数。
centers表示类别数。
cluster_std表示每个类别的方差，例如我们希望生成2类数据，其中一类比另一类具有更大的方差，可以将cluster_std设置为[1.0,3.0]。

样例samples:

from sklearn.datasets import make_blobs
from matplotlib import pyplot

data, label = make_blobs(n_samples=100, n_features=2, centers=4)
# 绘制样本显示
pyplot.scatter(data[:, 0], data[:, 1], c=label)
pyplot.show()

结果1
如果要设置方差，可以增加cluster_std参数

from sklearn.datasets import make_blobs
from matplotlib import pyplot

data, label = make_blobs(n_samples=30, n_features=2, centers=3, cluster_std=[0.8, 2.5, 4.5])
# 绘制样本显示
pyplot.scatter(data[:, 0], data[:, 1], c=label)
pyplot.show()

结果2