美文网首页
sklearn——dataset模块学习

sklearn——dataset模块学习

作者: 龙鹰图腾223 | 来源:发表于2020-07-09 14:04 被阅读0次

sklearn 的数据集有好多个种

自带的小数据集(packaged dataset):sklearn.datasets.load_<name>

可在线下载的数据集(Downloaded Dataset):sklearn.datasets.fetch_<name>

计算机生成的数据集(Generated Dataset):sklearn.datasets.make_<name>

svmlight/libsvm格式的数据集:sklearn.datasets.load_svmlight_file(...)

从买了data.org在线下载获取的数据集:sklearn.datasets.fetch_mldata(...)

1、datasets.load_digits

手写数字数据集

2、make_blobs函数

from sklearn.datasets import make_blobs

make_blobs函数是为聚类产生数据集

产生一个数据集和相应的标签

n_samples:表示数据样本点个数,默认值100

n_features:表示数据的维度,默认值是2

centers:产生数据的中心点,默认值3

cluster_std:数据集的标准差,浮点数或者浮点数序列,默认值1.0

center_box:中心确定之后的数据边界,默认值(-10.0, 10.0)

shuffle :洗乱,默认值是True

random_state:官网解释是随机生成器的种子

make_gaussian_quantiles

3、sklearn.datasets.make_sparse_coded_signal()

产生作为字典元素的稀疏组合生成信号。

【1】https://www.cnblogs.com/keye/p/8177995.html    sklearn dataset 模块学习

【2】https://blog.csdn.net/dataningwei/article/details/53649330    sklearn之样本生成(2)

相关文章

网友评论

      本文标题:sklearn——dataset模块学习

      本文链接:https://www.haomeiwen.com/subject/hilqmctx.html