美文网首页
seaborn常见绘图学习总结(分类图)

seaborn常见绘图学习总结(分类图)

作者: Rambogoal | 来源:发表于2020-04-30 11:22 被阅读0次

    接着上次的分布图继续总结

    一、目录:

    分布图

    • displot (直方图)
    • kedplot(概率密度图)
    • jointplot(联合密度图)
    • pairplot(多变量图)

    分类图

    • boxplot(箱线图)
    • violinplot(提琴图)

    回归图

    • lmplot (回归图)

    矩阵图

    • heatmap (热力图)

    二、分类图

    2.1、boxplot(箱线图)

    箱线图是用来表示跨类别变量之间的定量数据的分布情况。框体表示上下四分位数、线显示分布的其余部分,中间线表示的是中位数,在线外的则为离群值(异常数据)。具体参数为:

    seaborn.boxplot(x=None, y=None, hue=None, data=None, order=None, 
    hue_order=None, orient=None, color=None, palette=None, saturation=0.75, 
    width=0.8, dodge=True, fliersize=5, linewidth=None, whis=1.5, notch=False, ax=None, **kwargs)
    
    
    • data:数据集
    • x:数据集中哪一列数据作为x轴的分类变量
    • y:数据变量
    • hue:分类
    • saturation:float,饱和度
    • width:float,控制箱型图的宽度
    • fliersize:float,用于指示离群值观察标记大小
    区分不同区的房屋面积 用hue进行分类

    2.2、提琴图

    提琴图与箱线图类似,都是用来表示不同类别数据之间定量数据的分布情况。但是提琴图的绘图基础是密度图,通过提琴图可以知道定量数据的分布情况。在图中,白点是中位数,黑色盒型的范围是下四分位数到上四分位数,细黑线表示须。外部形状为密度分布曲线。

    seaborn.violinplot(x=None, y=None, hue=None, data=None, order=None, 
    hue_order=None, bw='scott', cut=2, scale='area', scale_hue=True, gridsize=100, 
    width=0.8, inner='box', split=False, dodge=True, orient=None, linewidth=None, 
    color=None, palette=None, saturation=0.75, ax=None, **kwargs)
    
    
    • data,x,y,hue:含义同上
    • bw:‘scott’, ‘silverman’, float,控制拟合程度。在计算内核带宽时,可以引用规则的名称(‘scott’, ‘silverman’)或者使用比例(float)。实际内核大小将通过将比例乘以每个bin内数据的标准差来确定
    • scale:“area”,“count”,“width”,用来缩放每个提琴图的宽度的方法。
      *scale_hue:当使用hue分类后,设置为True时,此参数确定是否在主分组变量进行缩放
    • gridsize:设置提琴图平滑度,越高越平滑
    • inner:“box”, “quartile”, “point”, “stick”, None,小提琴内部数据点的表示。分别表示:箱子,四分位,点,数据线和不表示;
    • split:是否拆分,与hue的分类结合使用
    默认情况 根据hue分类进行split,并根据count计数来画概率分布

    相关文章

      网友评论

          本文标题:seaborn常见绘图学习总结(分类图)

          本文链接:https://www.haomeiwen.com/subject/adqzwhtx.html