1 一元数据集的分布

作者: readilen | 来源:发表于2018-03-24 10:10 被阅读42次

本文将介绍一个python的数据可视化利器,seaborn结合matplotlib,在数据Exploration阶段助你无往不利!
我们拿到数据,第一件事就是想看看数据的分布,本章将介绍一元变量的分布。
首先导入必备的库:

%matplotlib inline
import pandas as pd
import numpy as np
from scipy import stats, integrate
import matplotlib,pyplot as plt
import seaborn as sns
sns.set(color_codes=True)
np.random.seed(sum(map(ord, "distribution")))

一元变量分布的画法

一元变量最快速的画法是distplot(), 默认将绘制直方图和核密度估计图(KDE)

x= np.random.normal(size=100)
sns.distplot(x)
dist

直方图(Histograms)

matplotlib中也有个直方图函数hist,表示每个bins中间散落的数据的个数,以此表示数据的分布。我们去掉密度曲线,使用rug(每个数据一个小竖线)来显示。当然单独的rugplot也能显示。

sns.distplot(x, kde=False, rug=True)
rug

核密度估计(Kernel density estimaton)

在绘制分布的形状上KDE是很有效的,y轴表示了密度值。

sns.distplot(x, hist=False, rug=True)
kde

带阴影的

sns.kdeplot(x, shade=True)
shade

高斯KDE,反应整体走势,去除极值

sns.kdeplot(x)
sns.kdeplot(x, bw=.2, label="bw: 0.2")
sns.kdeplot(x, bw=2, label="bw: 2")
plt.legend()
guass kde

另一个反应极值的参数是cut

sns.kdeplot(x, shade=True, cut=0)
sns.rugplot(x);
cut

相关文章

  • 1 一元数据集的分布

    本文将介绍一个python的数据可视化利器,seaborn结合matplotlib,在数据Exploration阶...

  • 2-基于RDD的开发

    RDD(resilient distributed dataset, 弹性分布式数据集) RDD的特点 1、分布式...

  • 训练和测试数据的观察

    训练和测试数据集的分布 在开始竞赛之前,我们要检查测试数据集的分布与训练数据集的分布,如果可能的话,看看它们之间有...

  • 【2019-06-23】RDD编程

    (1)弹性分布数据集 RDD以分区的形式分布在集群中多个机器上,每个分区代表了数据集的一个子集。分区定义了spar...

  • spark学习笔记-RDD(win+java)

    1、def: ​ RDD,弹性分布式数据集(Resilient Distributed Dataset...

  • Python 机器学习系列之线性回归(一)

    一元线性回归 1、导入库 2、定义线性回归模型 根据给定的数据集求解出a和b,即可确定适合该数据集的模型。那么 3...

  • spark RDD 结构最详解

    我们都知道RDD是弹性分布数据集,但是弹性的分布数据集是什么呢? 一种简单的解释RDD是横向多分区的(这个数据集包...

  • spark chapter 3 RDD

    # 1 什么是RDD *Resilient Distributed Dataset弹性分布式数据集 *Repres...

  • pySpark工具学习2-弹性分布式数据集(RDD Resili

    弹性分布式数据集(RDD Resilient Distributed Dataset)是不可变JVM对象的分布式集...

  • kaggle经典学习

    1 考核方式:Public LB(验证集) 和 Private LB(测试集) 2数据分析 分析特征分布 分析特征...

网友评论

  • IT人故事会:经常看别人的分享.感谢别人的分享,感谢!关注了
    IT人故事会:@readilen 希望可以坚持,这是最重要的!
    readilen:分享促进共同成长

本文标题:1 一元数据集的分布

本文链接:https://www.haomeiwen.com/subject/fhxqcftx.html