接着上次的分布图继续总结
一、目录:
分布图
- displot (直方图)
- kedplot(概率密度图)
- jointplot(联合密度图)
- pairplot(多变量图)
分类图
- boxplot(箱线图)
- violinplot(提琴图)
回归图
- lmplot (回归图)
矩阵图
- heatmap (热力图)
二、分类图
2.1、boxplot(箱线图)
箱线图是用来表示跨类别变量之间的定量数据的分布情况。框体表示上下四分位数、线显示分布的其余部分,中间线表示的是中位数,在线外的则为离群值(异常数据)。具体参数为:
seaborn.boxplot(x=None, y=None, hue=None, data=None, order=None,
hue_order=None, orient=None, color=None, palette=None, saturation=0.75,
width=0.8, dodge=True, fliersize=5, linewidth=None, whis=1.5, notch=False, ax=None, **kwargs)
- data:数据集
- x:数据集中哪一列数据作为x轴的分类变量
- y:数据变量
- hue:分类
- saturation:float,饱和度
- width:float,控制箱型图的宽度
- fliersize:float,用于指示离群值观察标记大小
2.2、提琴图
提琴图与箱线图类似,都是用来表示不同类别数据之间定量数据的分布情况。但是提琴图的绘图基础是密度图,通过提琴图可以知道定量数据的分布情况。在图中,白点是中位数,黑色盒型的范围是下四分位数到上四分位数,细黑线表示须。外部形状为密度分布曲线。
seaborn.violinplot(x=None, y=None, hue=None, data=None, order=None,
hue_order=None, bw='scott', cut=2, scale='area', scale_hue=True, gridsize=100,
width=0.8, inner='box', split=False, dodge=True, orient=None, linewidth=None,
color=None, palette=None, saturation=0.75, ax=None, **kwargs)
- data,x,y,hue:含义同上
- bw:‘scott’, ‘silverman’, float,控制拟合程度。在计算内核带宽时,可以引用规则的名称(‘scott’, ‘silverman’)或者使用比例(float)。实际内核大小将通过将比例乘以每个bin内数据的标准差来确定
- scale:“area”,“count”,“width”,用来缩放每个提琴图的宽度的方法。
*scale_hue:当使用hue分类后,设置为True时,此参数确定是否在主分组变量进行缩放 - gridsize:设置提琴图平滑度,越高越平滑
- inner:“box”, “quartile”, “point”, “stick”, None,小提琴内部数据点的表示。分别表示:箱子,四分位,点,数据线和不表示;
- split:是否拆分,与hue的分类结合使用
网友评论