美文网首页
seaborn库学习

seaborn库学习

作者: fan的心情记录 | 来源:发表于2020-02-21 22:49 被阅读0次

%matplotlib作用:

当你调用matplotlib.pyplot的绘图函数plot()进行绘图的时候,或者生成一个figure画布的时候,可以直接在你的python console里面生成图像

%matplotlib inline

一张图绘制出来每类的散点图:(适用于一个连续,一个离散的两种属性。)

方法:

stripplot: 可以绘制分类数据的散点图,由于过多的点会聚集一处,使用jitter 进行随机抖动,以在每一个分类数据中对应变量在某一点的集中/分布趋势。

        sns.stripplot(x="SEX",y="BILL_AMT1",data=train,jitter=True)

swarmplot: 函数会使用内置的算法对数据进行抖动,保证点不会重合.

        sns.swarmplot(x="SEX",y="BILL_AMT1",data=train,size=10)

不同性别的散点分布图swarmplot

直方图(连续属性分段查看分布)

        sns.distplot(train.LIMIT_BAL,bins=20,kde=True,rug=True)

当Bins=None的时候,自动计算一个默认的合适的bin大小

kde :是否绘制高斯核密度估计图

rug:是否在横轴上绘制观测值竖线。

柱状图(连续属性分段查看分布)

        sns.barplot(x="MARRIAGE",y="BILL_AMT1",data=train)

点图(表示一个数值的中心趋势的估计。根据散点图点的位置变化,并提供一些,用误差线表示该估计的不确定性)

        sns.pointplot(x="EDUCATION",y="BILL_AMT1",data=train)


双变量图

        sns.jointplot(x="EDUCATION",y="BILL_AMT1",data=train)

        sns.jointplot(x="EDUCATION",y="BILL_AMT1",data=train,kind='hex')

        sns.jointplot(x="EDUCATION",y="BILL_AMT1",data=train,kind='kde')

kde代表的是核密度函数

        sns.heatmap(train.iloc[:10,2:4])

热力图

箱线图

        sns.boxplot(x="EDUCATION",y="BILL_AMT1",data=train)

小提琴图

’‘’

fig,axes=plt.subplots(2,2,figsize=(20,20))

sns.violinplot(x="EDUCATION",y="BILL_AMT1",data=train,ax=axes[0,0])

sns.violinplot(x="EDUCATION",y="BILL_AMT1",data=train,ax=axes[0,1],hue="EDUCATION")

sns.violinplot(x="EDUCATION",y="BILL_AMT1",data=train,ax=axes[1,0],hue="EDUCATION",inner="stick")

sns.violinplot(x="EDUCATION",y="BILL_AMT1",data=train,ax=axes[1,1],hue="EDUCATION",inner=None)

sns.swarmplot(x="EDUCATION",y="BILL_AMT1",data=train,ax=axes[1,1],alpha=.5,hue="EDUCATION",color="r")

‘’‘

inner:{“box”, “quartile”, “point”, “stick”, None},可选

控制小提琴图内部数据点的表示。若为box,则绘制一个微型箱型图。若为quartiles,则显示四分位数线。若为point或stick,则显示具体数据点或数据线。使用None则绘制不加修饰的小提琴图。

        sns.lmplot(x="BILL_AMT1",y="BILL_AMT2",data=train)

        sns.regplot(x="BILL_AMT1",y="BILL_AMT2",data=train,order=2)

‘’‘

l=["LIMIT_BAL","AGE","BILL_AMT1","BILL_AMT2","PAY_AMT1","PAY_AMT2"]

sns.pairplot(train[l])

’‘’

当需要快速了解数据集中属性两两关系时. 数据需要是连续值且非空

‘’‘

g=sns.FacetGrid(train,col="SEX")

g.map(plt.hist,"LIMIT_BAL")

g.add_legend()

’‘’

参考:https://zhuanlan.zhihu.com/p/58965456

相关文章

网友评论

      本文标题:seaborn库学习

      本文链接:https://www.haomeiwen.com/subject/bczcqhtx.html