进行数据分析时,对数据的可视化展示可以更直观的展现数据的关系。热度图使用颜色直观地反应二维空间数值大小的分布。
开始今天的任务前,我们先来导入工具包,并执行魔法指令:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
%matplotlib inline
np.random.seed(0)
下面,随机构造一个 DataFrame ,并制定列名和索引:
data = pd.DataFrame(
data=np.random.rand(3,3),
columns=['a1','a2','a3'],
index=['b1','b2','b3']
)
data
接下里,我们将该二维表以热度图的形式呈现出来:
heatmap = sns.heatmap(data)
绘制结果:
从该热度图中,我们可以直观地看出表格中的哪些位置数值分布大,哪些位置的数值较小,以及呈现出怎样的变化规律。当然,这里的数据是小鱼随意构造的,后面我们会看一个有规律可循的数据集热图。
在绘制热度图时,可以设置 vmin
和 vmax
,这样小于 vmin
的数值都将使用同一种颜色绘制,大于 vmax
的数值也将使用同一种颜色。
sns.heatmap(data, vmin=0.3, vmax=0.6)
绘制结果:
当然,也可以指定中间的值 center
:
sns.heatmap(data, center=0.5)
绘制结果:
下面,我们来看一份航班旅客数量的信息表:
flights = sns.load_dataset("flights")
flights.head()
数据如下:
我们将该 DataFrame 制作成数据透视表:
flights = flights.pivot(columns="year", index="month", values="passengers")
flights
数据透视表以 year 列为列索引,以 month 列为行索引,passengers 为值。
下面,使用热度图绘制出该数据透视表:
sns.heatmap(flights)
绘制结果:
我们可以清晰地发现,从 1949 年至 1960 年旅客数量总体在不断增加,其中每年的 6 月至 8 月为旅客数量最集中的时间段。
还可以在热度图中绘出具体的值:
sns.heatmap(flights, annot=True, fmt="d")
fmt
表示数字的显示格式,默认为科学计数法:
下面的画法也很不错,就是在绘制时把每个小格子的边框画出来:
sns.heatmap(flights, linewidths=0.5)
绘制结果:
为热度图自定义 color bar 调色板时,使用参数 cmap
指定即可:
sns.heatmap(flights, cmap="YlGnBu")
sns.heatmap(flights, cmap="BuPu_r")
这里讲个小技巧,如何看 cmap
有哪些字符串值选项呢?故意输一个不存在的颜色,报错提示就会告诉我们啦:
ValueError: 'RdGnBu' is not a valid value for name; supported values are 'Accent', 'Accent_r', 'Blues', 'Blues_r', 'BrBG', 'BrBG_r', 'BuGn', 'BuGn_r', 'BuPu', 'BuPu_r', 'CMRmap', 'CMRmap_r', 'Dark2', 'Dark2_r', 'GnBu', 'GnBu_r', 'Greens', 'Greens_r', 'Greys', 'Greys_r', 'OrRd', 'OrRd_r', 'Oranges', 'Oranges_r', 'PRGn', 'PRGn_r', 'Paired', 'Paired_r', 'Pastel1', 'Pastel1_r', 'Pastel2', 'Pastel2_r', 'PiYG', 'PiYG_r', 'PuBu', 'PuBuGn', 'PuBuGn_r', 'PuBu_r', 'PuOr', 'PuOr_r', 'PuRd', 'PuRd_r', 'Purples', 'Purples_r', 'RdBu', 'RdBu_r', 'RdGy', 'RdGy_r', 'RdPu', 'RdPu_r', 'RdYlBu', 'RdYlBu_r', 'RdYlGn', 'RdYlGn_r', 'Reds', 'Reds_r', 'Set1', 'Set1_r', 'Set2', 'Set2_r', 'Set3', 'Set3_r', 'Spectral', 'Spectral_r', 'Wistia', 'Wistia_r', 'YlGn', 'YlGnBu', 'YlGnBu_r', 'YlGn_r', 'YlOrBr', 'YlOrBr_r', 'YlOrRd', 'YlOrRd_r', 'afmhot', 'afmhot_r', 'autumn', 'autumn_r', 'binary', 'binary_r', 'bone', 'bone_r', 'brg', 'brg_r', 'bwr', 'bwr_r', 'cividis', 'cividis_r', 'cool', 'cool_r', 'coolwarm', 'coolwarm_r', 'copper', 'copper_r', 'crest', 'crest_r', 'cubehelix', 'cubehelix_r', 'flag', 'flag_r', 'flare', 'flare_r', 'gist_earth', 'gist_earth_r', 'gist_gray', 'gist_gray_r', 'gist_heat', 'gist_heat_r', 'gist_ncar', 'gist_ncar_r', 'gist_rainbow', 'gist_rainbow_r', 'gist_stern', 'gist_stern_r', 'gist_yarg', 'gist_yarg_r', 'gnuplot', 'gnuplot2', 'gnuplot2_r', 'gnuplot_r', 'gray', 'gray_r', 'hot', 'hot_r', 'hsv', 'hsv_r', 'icefire', 'icefire_r', 'inferno', 'inferno_r', 'jet', 'jet_r', 'magma', 'magma_r', 'mako', 'mako_r', 'nipy_spectral', 'nipy_spectral_r', 'ocean', 'ocean_r', 'pink', 'pink_r', 'plasma', 'plasma_r', 'prism', 'prism_r', 'rainbow', 'rainbow_r', 'rocket', 'rocket_r', 'seismic', 'seismic_r', 'spring', 'spring_r', 'summer', 'summer_r', 'tab10', 'tab10_r', 'tab20', 'tab20_r', 'tab20b', 'tab20b_r', 'tab20c', 'tab20c_r', 'terrain', 'terrain_r', 'turbo', 'turbo_r', 'twilight', 'twilight_r', 'twilight_shifted', 'twilight_shifted_r', 'viridis', 'viridis_r', 'vlag', 'vlag_r', 'winter', 'winter_r'
最后,如果你不想展示 Color Bar 也可以选择将其隐藏:
sns.heatmap(flights, cbar=False)
网友评论