参考官网教程,首先看看seaborn.heatmap的函数定义形式
seaborn.heatmap(data, vmin=None, vmax=None, cmap=None, center=None, robust=False, annot=None, fmt='.2g', annot_kws=None, linewidths=0, linecolor='white', cbar=True, cbar_kws=None, cbar_ax=None, square=False, xticklabels='auto', yticklabels='auto', mask=None, ax=None, **kwargs)
numpy数组绘制热图
import numpy as np; np.random.seed(0)
import seaborn as sns; sns.set()
import matplotlib.pyplot as plt
uniform_data = np.random.rand(10, 12)
f, ax = plt.subplots(figsize=(9, 6))
ax = sns.heatmap(uniform_data)
plt.show()
随机创建10行12列的数组,定义一个子图宽高为9和6,应用到热力图中,得到如下图所示:
image.png
现在在上图的基础上改变一下色彩图的上下界:
ax = sns.heatmap(uniform_data, vmin=0, vmax=1)
和上图对比就会发现色彩图的上下界更明确了(不知道这一点理解的对不对,欢迎大佬来纠正)
使用发散色图绘制以0为中心的数据的热力图
这里使用的是np.random.randn()函数,和上面的np.random.rand()函数不一样的。因为这个函数可以返回一个或一组服从标准正态分布的随机样本值,上面的np.random.rand()函数返回一个或一组服从0~1均匀分布的随机样本值,随机样本取值范围是[0,1),不包括1
uniform_data = np.random.randn(10, 12)
f, ax = plt.subplots(figsize=(9, 6))
ax = sns.heatmap(uniform_data, center=0)
plt.show()
输出的结果如下:
image.png
为行和列加上有意义的标签
使用sns.load_dataset("flights")自带的数据集,数据集的部分截图如下,共143行数据:
接着使用了一个特别高效的函数pivot(),该函数有三个参数(index,columns,values),第一个参数index是指新表的索引,第二个参数columns是新表的列名,第三个参数values是指新表中的值,看效果就比较明确了
flights = flights.pivot("month", "year", "passengers")
image.png
由表可以看出第一个参数就是行标,第二个参数是列标,第三个参数是表中的值。
显示一下热力图
ax = sns.heatmap(flights)
plt.show()
image.png
使用整型格式的数值为每个单元格注释
ax = sns.heatmap(flights, annot=True, fmt="d")
heatmap中的参数annot为True时,为每个单元格写入数据值。如果数组具有与数据相同的形状,则使用它来注释热力图而不是原始数据。参数fmt是指添加注释时要使用的字符串格式代码
为每个单元格之间添加行
ax = sns.heatmap(flights, linewidths=.5)
heatmap函数中的参数linewidths是指划分每个单元格的行的宽度
换一个不同的色彩图
ax = sns.heatmap(flights, cmap="RdPu")
heatmap函数中的参数cmap是指色彩颜色的选择,可选的颜色还有很多,比如:Accent, Accent_r, Blues, Blues_r, BrBG, BrBG_r, BuGn, BuGn_r, BuPu, BuPu_r, CMRmap, CMRmap_r, Dark2, Dark2_r, GnBu, GnBu_r, Greens, Greens_r, Greys, Greys_r, OrRd, OrRd_r, Oranges, Oranges_r, PRGn, PRGn_r, Paired, Paired_r, Pastel1, Pastel1_r, Pastel2, Pastel2_r, PiYG, PiYG_r, PuBu, PuBuGn, PuBuGn_r, PuBu_r, PuOr, PuOr_r, PuRd, PuRd_r, Purples, Purples_r, RdBu, RdBu_r, RdGy, RdGy_r, RdPu, RdPu_r, RdYlBu, RdYlBu_r, RdYlGn, RdYlGn_r, Reds, Reds_r, Set1, Set1_r, Set2, Set2_r, Set3, Set3_r, Spectral, Spectral_r, Wistia, Wistia_r, YlGn, YlGnBu, YlGnBu_r, YlGn_r, YlOrBr, YlOrBr_r, YlOrRd, YlOrRd_r...其中末尾加r是颜色取反
将色彩图特定值设为中心
ax = sns.heatmap(flights, center=flights.loc["January", 1955])
image.png
只绘制列标签不绘制行标签
ax = sns.heatmap(data, xticklabels=2, yticklabels=False)
heatmap函数中的参数xticklabels,yticklabels如果是True则绘制数据框的列名称;如果是False则不绘制列名称,如果是列表则将这些替代标签绘制为xticklabels;如果是整数则使用列名称也只是绘制n个标签;如果是自动的,请尝试密集绘制不重叠的标签。
不绘制颜色条
flights = sns.load_dataset("flights")
flights = flights.pivot("month", "year", "passengers")
ax = sns.heatmap(flights, cbar=False)
plt.show()
heatmap函数中的参数cbar为TRUE即绘制颜色条,为False就不绘制颜色条。
使用 不同的轴作为颜色条
grid_kws = {"height_ratios": (.9, .05), "hspace": .3}
f, (ax, cbar_ax) = plt.subplots(2, gridspec_kw=grid_kws)
ax = sns.heatmap(flights, ax=ax,
cbar_ax=cbar_ax,
cbar_kws={"orientation": "horizontal"})
plt.show()
subplots函数中的参数gridspec_kw是将字典的关键字传递给GridSpec构造函数创建子图放在网格里。heatmap函数中的参数ax指绘制图的轴,否则使用当前活动的轴,cbar_ax用于绘制颜色条的轴,否则从主轴获取;cbar_kwsfig.colorbar的关键字参数.这部分不太会用大白话解释,直接上图吧
仅绘制矩阵的一部分
corr = np.corrcoef(np.random.randn(10, 200))
mask = np.zeros_like(corr)
print(mask)
mask[np.triu_indices_from(mask)] = True
with sns.axes_style("white"):
ax = sns.heatmap(corr, mask=mask, vmax=.3, square=True)
plt.show()
首先创建一组服从正太分布的矩阵,并计算其每一列的相关系数记为corr,创建这么多0矩阵。np.triu_indices_from(mask)这个函数一直不太理解什么意思,把输出放在这里,以后有机会遇到再再补充和纠正
heatmap函数中的参数mask如果通过,则数据不会显示在mask为True的单元格中,具有缺失值的单元格将自动被屏蔽。参数square为Ture,则将Axes方面设置为相等,并使其每个单元格为方形。参数vmax用于锚定色彩图的值,否则会从数据和其他关键字参数推断出来,但是这里为3还是不太理解。直接贴出热力图吧
image.png
网友评论