sklearn中自带的数据集

sklearn中自带的数据集

作者: 曦宝 | 来源:发表于2018-08-09 10:47 被阅读101次

sklearn——dataset模块学习
sklearn-dataset
Iris鸢尾花数据集可视化、线性回归、决策树分析、KMeans聚
sklearn中自带的数据集
「补充」19sklearn库自带标准数据集说明
降维算法——PCA对人脸识别数据集的降维
模型调参——随机森林在乳腺癌数据集上的调参应用
K近邻算法-数据集处理-属性描述-数据集可视化-数据集划分
scikit-learn数据集
集成学习（2）- 回归模型

我没有单独安装sklearn，而是使用Anaconda，下面是sklearn中自带数据的存放目录，前面是我的安装目录。
sklearn也可以自己生成数据集，我今后涉及到了在研究把。
D:\ProgramData\Anaconda3\pkgs\scikit-learn-0.19.0-py36h294a771_2\Lib\site-packages\sklearn\datasets\data
调用方法：
from sklearn.datasets import load_digits
from sklearn.datasets import load_boston
我暂时只用到这两个部分，其他的数据后面改名字就可以了。
下面是sklearn包含的数据的截图。

image.png

下面只介绍大概，想知道更具体的属性之类的可以跟进去看一下源码

1、boston_house_prices

波士顿房价的数据，经典的回归任务的数据。

image.png

样本总数506
维度13，第14列是target
feature真实值，正值
target值在5-50之间。

2、breast_cancer

乳腺癌数据，经典的用于二分类的数据。

3、diabetes_data

糖尿病数据，回归数据集。十个特征都被处理成0均值，方差归一化的特征。

4、digits

手写字体识别，分类数据，10个类别。

image.png

label10个类别，0-9。
feature总共64维，1-64列为feature，65列为label值。
feature值为0-16的integer。
每一个数字离散成8*8的像素块，64列分别为每一个块的亮度。

5、iris

鸢尾花数据集，多分类。三中类别，四个属性，每个属性50个样本，共150个样本。

image.png

6、linnerud

体能训练数据集，经典的用于多变量回归任务的数据集，其内部包含两个小数据集：Excise是对3个训练变量的20次观测（体重，腰围，脉搏），physiological是对3个生理学变量的20次观测（引体向上，仰卧起坐，立定跳远）

7、wine

葡萄酒产地，分类数据，178条数据，3个类别。

相关文章

sklearn——dataset模块学习
sklearn 的数据集有好多个种自带的小数据集（packaged dataset）：sklearn.datas...
sklearn-dataset
sklearn 的数据集有好多个种 1. 自带的小数据集（packaged dataset）：sklearn.da...
Iris鸢尾花数据集可视化、线性回归、决策树分析、KMeans聚
数据集可视化采用Python的Sklearn机器学习库中自带的数据集——鸢尾花数据集。简单分析数据集之间特征的关...
sklearn中自带的数据集
我没有单独安装sklearn，而是使用Anaconda，下面是sklearn中自带数据的存放目录，前面是我的安装目...
「补充」19sklearn库自带标准数据集说明
sklearn库中自带的标准数据集有：前面有用到过的数据集说明：（1）波士顿房价数据集(boston)包含50...
降维算法——PCA对人脸识别数据集的降维
一、数据来源 Sklearn自带数据集fetch_lfw_people 二、模型选择降维使用Sklearn的de...
模型调参——随机森林在乳腺癌数据集上的调参应用
一、数据集 Sklearn自带数据集——乳腺癌数据集二、模型选择乳腺癌数据集是二分类模型，选择随机森林模型进行...
K近邻算法-数据集处理-属性描述-数据集可视化-数据集划分
一、概述： 1、获取数据集：小数据集：sklearn.datasets.load_* 大数据集：sklearn....
scikit-learn数据集
scikit-learn数据集我们将介绍sklearn中的数据集类，模块包括用于加载数据集的实用程序，包括加载和...
集成学习（2）- 回归模型
接下来我们开始构建简单的回归模型，并使用sklearn中自带的数据集进行演示。我们会介绍三种常用的回归模型，分别是...

网友评论

本文标题：sklearn中自带的数据集

本文链接：https://www.haomeiwen.com/subject/gukqbftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|sklearn中自带的数据集|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！