可视化库Seaborn

作者: owolf | 来源:发表于2018-09-04 17:23 被阅读3次

    一、主题风格

    风格:darkgrid、whitegrid、dark、white、ticks

    执行下面函数的各种风格演示:

    默认matplotlib风格:

    dark风格:

    white风格:

    ticks风格:

    darkgrid风格:

    whitegrid风格:

    set()函数表示默认风格:

    despine()函数:

    set_context函数:

    二、颜色

    默认颜色:

    需要使用比当前默认颜色循环中设置的颜色更多时,最常用的方法是使用hls的颜色空间,这是RGB值的一个简单转换。

    连续色板:

    色彩随数据变换,比如数据越来越重要则颜色越来越深

    三、单变量分析绘图

    根据均值和协方差生成数据:

    观测两个变量之间的分布关系最好用散点图:

    数据量较大时,传入参数:kind="hex"

    多个特征,根据两两特征作图:

    四、回归分析绘图

    加载数据集

    regplot()和lmplot()都可以绘制回归关系,推荐regplot()

    两个维度数据都是连续的:散点图 + 线性回归 + 95%置信区间:

    一个维度数据是连续的,一个维度数据是离散的,连续轴抖动x_jitter参数:

    lmplot的hue参数按cloumns分组,一图多组:

    markers参数标示实例点,size参数控制图形大小:

    lmplot的hue参数按cloumns分组,加col参数——列增加,加row参数——行增加:

    lmplot的col参数分出来多组后,col_wrap参数控制图形显示排布;size参数设置图形大小,aspect参数设置图形横纵比:

    lmplot的order参数,设置高阶拟合(lmplot默认order参数是一阶的):

    五、分类

    重叠是很常见的现象,但是重叠影响我观察数据的量了  

    六、其他

    IQR即统计学概念四分位距,第一/四分位与第三/四分位之间的距离

    N = 1.5IQR 如果一个值>Q3+N或 < Q1-N,则为离群点

    显示值的集中趋势可以用条形图:

    点图:更好的描述变化差异

    多层面板分类图factorplot:

    seaborn.factorplot(x=None, y=None, hue=None, data=None, row=None, col=None, col_wrap=None, estimator=, ci=95, n_boot=1000, units=None, order=None, hue_order=None, row_order=None, col_order=None, kind='point', size=4, aspect=1, orient=None, color=None, palette=None, legend=True, legend_out=True, sharex=True, sharey=True, margin_titles=False, facet_kws=None, **kwargs)

    七、FacetGrid

    八、热度图

    相关文章

      网友评论

        本文标题:可视化库Seaborn

        本文链接:https://www.haomeiwen.com/subject/oeebwftx.html