%matplotlib作用:
当你调用matplotlib.pyplot的绘图函数plot()进行绘图的时候,或者生成一个figure画布的时候,可以直接在你的python console里面生成图像
%matplotlib inline
一张图绘制出来每类的散点图:(适用于一个连续,一个离散的两种属性。)
方法:
stripplot: 可以绘制分类数据的散点图,由于过多的点会聚集一处,使用jitter 进行随机抖动,以在每一个分类数据中对应变量在某一点的集中/分布趋势。
sns.stripplot(x="SEX",y="BILL_AMT1",data=train,jitter=True)

swarmplot: 函数会使用内置的算法对数据进行抖动,保证点不会重合.
sns.swarmplot(x="SEX",y="BILL_AMT1",data=train,size=10)

直方图(连续属性分段查看分布)
sns.distplot(train.LIMIT_BAL,bins=20,kde=True,rug=True)
当Bins=None的时候,自动计算一个默认的合适的bin大小
kde :是否绘制高斯核密度估计图
rug:是否在横轴上绘制观测值竖线。

柱状图(连续属性分段查看分布)
sns.barplot(x="MARRIAGE",y="BILL_AMT1",data=train)

点图(表示一个数值的中心趋势的估计。根据散点图点的位置变化,并提供一些,用误差线表示该估计的不确定性)
sns.pointplot(x="EDUCATION",y="BILL_AMT1",data=train)

双变量图
sns.jointplot(x="EDUCATION",y="BILL_AMT1",data=train)

sns.jointplot(x="EDUCATION",y="BILL_AMT1",data=train,kind='hex')

sns.jointplot(x="EDUCATION",y="BILL_AMT1",data=train,kind='kde')
kde代表的是核密度函数

sns.heatmap(train.iloc[:10,2:4])
热力图

箱线图
sns.boxplot(x="EDUCATION",y="BILL_AMT1",data=train)

小提琴图
’‘’
fig,axes=plt.subplots(2,2,figsize=(20,20))
sns.violinplot(x="EDUCATION",y="BILL_AMT1",data=train,ax=axes[0,0])
sns.violinplot(x="EDUCATION",y="BILL_AMT1",data=train,ax=axes[0,1],hue="EDUCATION")
sns.violinplot(x="EDUCATION",y="BILL_AMT1",data=train,ax=axes[1,0],hue="EDUCATION",inner="stick")
sns.violinplot(x="EDUCATION",y="BILL_AMT1",data=train,ax=axes[1,1],hue="EDUCATION",inner=None)
sns.swarmplot(x="EDUCATION",y="BILL_AMT1",data=train,ax=axes[1,1],alpha=.5,hue="EDUCATION",color="r")
‘’‘
inner:{“box”, “quartile”, “point”, “stick”, None},可选
控制小提琴图内部数据点的表示。若为box,则绘制一个微型箱型图。若为quartiles,则显示四分位数线。若为point或stick,则显示具体数据点或数据线。使用None则绘制不加修饰的小提琴图。

sns.lmplot(x="BILL_AMT1",y="BILL_AMT2",data=train)
sns.regplot(x="BILL_AMT1",y="BILL_AMT2",data=train,order=2)
‘’‘
l=["LIMIT_BAL","AGE","BILL_AMT1","BILL_AMT2","PAY_AMT1","PAY_AMT2"]
sns.pairplot(train[l])
’‘’
当需要快速了解数据集中属性两两关系时. 数据需要是连续值且非空

‘’‘
g=sns.FacetGrid(train,col="SEX")
g.map(plt.hist,"LIMIT_BAL")
g.add_legend()
’‘’

网友评论