一、主题风格
风格:darkgrid、whitegrid、dark、white、ticks
执行下面函数的各种风格演示:
默认matplotlib风格:
dark风格:
white风格:
ticks风格:
darkgrid风格:
whitegrid风格:
set()函数表示默认风格:
despine()函数:
set_context函数:
二、颜色
默认颜色:
需要使用比当前默认颜色循环中设置的颜色更多时,最常用的方法是使用hls的颜色空间,这是RGB值的一个简单转换。
连续色板:
色彩随数据变换,比如数据越来越重要则颜色越来越深
三、单变量分析绘图
根据均值和协方差生成数据:
观测两个变量之间的分布关系最好用散点图:
数据量较大时,传入参数:kind="hex"
多个特征,根据两两特征作图:
四、回归分析绘图
加载数据集
regplot()和lmplot()都可以绘制回归关系,推荐regplot()
两个维度数据都是连续的:散点图 + 线性回归 + 95%置信区间:
一个维度数据是连续的,一个维度数据是离散的,连续轴抖动x_jitter参数:
lmplot的hue参数按cloumns分组,一图多组:
markers参数标示实例点,size参数控制图形大小:
lmplot的hue参数按cloumns分组,加col参数——列增加,加row参数——行增加:
lmplot的col参数分出来多组后,col_wrap参数控制图形显示排布;size参数设置图形大小,aspect参数设置图形横纵比:
lmplot的order参数,设置高阶拟合(lmplot默认order参数是一阶的):
五、分类
重叠是很常见的现象,但是重叠影响我观察数据的量了
六、其他
IQR即统计学概念四分位距,第一/四分位与第三/四分位之间的距离
N = 1.5IQR 如果一个值>Q3+N或 < Q1-N,则为离群点
显示值的集中趋势可以用条形图:
点图:更好的描述变化差异
多层面板分类图factorplot:
seaborn.factorplot(x=None, y=None, hue=None, data=None, row=None, col=None, col_wrap=None, estimator=, ci=95, n_boot=1000, units=None, order=None, hue_order=None, row_order=None, col_order=None, kind='point', size=4, aspect=1, orient=None, color=None, palette=None, legend=True, legend_out=True, sharex=True, sharey=True, margin_titles=False, facet_kws=None, **kwargs)
网友评论