美文网首页
Python 数据可视化:数据分布统计图和热图

Python 数据可视化:数据分布统计图和热图

作者: you的日常 | 来源:发表于2020-12-03 11:31 被阅读0次

本课将继续介绍 Seaborn 中的统计图。一定要牢记,Seaborn 是对 Matplotlib 的高级封装,它优化了很多古老的做图过程,因此才会看到一个函数解决问题的局面。

2.4.1 数据分布统计图

在统计学中,研究数据的分布情况,也是一个重要的工作,比如某些数据是否为正态分布——某些机器学习模型很在意数据的分布情况。

在 Matplotlib 中,可以通过绘制直方图将数据的分布情况可视化。在 Seaborn 中,也提供了绘制直方图的函数。

%matplotlib inline
import seaborn as sns
import numpy as np
sns.set()
np.random.seed(0)
x = np.random.randn(100)
ax = sns.distplot(x)

输出结果:

enter image description here

sns.distplot 函数即实现了直方图,还顺带把曲线画出来了——曲线其实代表了 KDE。

seaborn.distplot(a, bins=None, hist=True, kde=True, rug=False, fit=None, hist_kws=None, kde_kws=None, rug_kws=None, fit_kws=None, color=None, vertical=False, norm_hist=False, axlabel=None, label=None, ax=None)

除了 sns.distplot 之外,在 Seaborn 中还有另外一个常用的绘制数据分布的函数 sns.kdeplot,它们的使用方法类似。

2.4.2 联合统计图

首先看这样一个示例。

sns.set(rc={'axes.facecolor':'cornflowerblue', 'figure.facecolor':'cornflowerblue'})    #①
tips = sns.load_dataset("tips")
jg = sns.JointGrid(x='total_bill', y='tip', data=tips)    #②

输出结果:

image

① 的作用是设置所得图示的背景颜色,这样做的目的是让下面的 ② 绘制的图像显示更清晰,如果不设置 ①,在显示的图示中看到的就是白底图像,有的部分看不出来。

② 最终得到的是坐标网格,而且在图中分为三部分,如下图所示。

image

相对于以往的坐标网格,多出了 B 和 C 两个部分。也就是说,不仅可以在 A 部分绘制某种统计图,在 B 和 C 部分也可以绘制。

继续操作:

jg = sns.JointGrid(x='total_bill', y='tip', data=tips)
jg.plot(sns.regplot, sns.distplot)    #③

输出结果:

image

语句 ③ 实现了在坐标网格中绘制统计图的效果,jp.plot 方法以两个绘图函数为参数,分别在 A 部分绘制了回归统计图,在 B 和 C 部分绘制了直方图,而且直方图分别表示了对应坐标轴数据的分布,即:

  • A 部分表示的是两个特征之间的关系;
  • B 和 C 部分分别表示某一个特征的数据分布。

我们把有语句 ② 和 ③ 共同实现的统计图,称为联合统计图。除了用 ② ③ 两句可以绘制这种图之外,还有一个函数也能够“两步并作一步”,具体如下:

seaborn.jointplot(x, y, data=None, kind='scatter', stat_func=None, color=None, height=6, ratio=5, space=0.2, dropna=True, xlim=None, ylim=None, joint_kws=None, marginal_kws=None, annot_kws=None, **kwargs)

注意,参数 kind 的取值只能是“scatter”、“reg”、“resid”、“kde”、“hex”中的一个,这就规定了在 A 区中所显示的统计图的种类。

sns.set()
sns.jointplot(x="total_bill", y="tip", kind='reg', data=tips)    #④

输出结果:

相关文章

  • Seaborn简介

    Seaborn 数据集分布可视化 类别数据可视化 类别散布图 类别内数据分布 类别内统计图

  • Python 数据可视化:数据分布统计图和热图

    本课将继续介绍 Seaborn 中的统计图。一定要牢记,Seaborn 是对 Matplotlib 的高级封装,它...

  • 用Python进行数据分析-01

    数据可视化基础(一) 01常用统计图 数据可视化,即将数据以图形化的形式展示出来,常用统计图: ①折线图:以折现的...

  • Python数据可视化的四种简易方法

    摘要: 本文讲述了热图、二维密度图、蜘蛛图、树形图这四种Python数据可视化方法。 数据可视化是任何数据科学或机...

  • Python数据分析:matplotlib!

    matplotlib是python中的一个数据可视化库,可以做出很多数据统计图,下面来说一说matplotlib的...

  • R可视化:基础图形可视化之Correlation(四)

    数据分析的图形可视化是了解数据分布、波动和相关性等属性必不可少的手段。数据相关可视化图形主要有:散点图、热图、相关...

  • ggplot2 - 箱线图(Box - plot)

    简介 箱线图,顾明思义,是形状像箱子并展示一组或多组数据分布的统计图,被认为是一个优于柱形图的数据可视化方案,文章...

  • Seaborn

    功能简介 计算多变量间关系 可视化类别变量的观测与统计 可视化单变量或多变量分布并与其子数据集比较 对多表统计图的...

  • python-web

    python数据统计之web显示 参考链接 csdn web模块:flask python模块生成数据统计图 fl...

  • matplotlib可视化篇hist()--直方图

    直方图与柱状图外观表现很相似,用来展现连续型数据分布特征的统计图形(柱状图主要展现离散型数据分布),官方hist项...

网友评论

      本文标题:Python 数据可视化:数据分布统计图和热图

      本文链接:https://www.haomeiwen.com/subject/sxlebktx.html