本文目录如下:
1 风格设定
1.1 sns.set_style()
1.2 sns.despine()
1.3 不同子图,不同风格
1.4 sns.set_context()
2 调色板
2.1 色块
2.2 对比颜色块
2.3 连续颜色块
2.4 简单应用
2.4.1 sns.color_palette()----箱线图
2.4.2 使用xkcd颜色来命名颜色---线图
2.4.3 sns.dark_palette()---核密度估计图
3 因子变量绘图
3.1 boxplot箱线图
3.2 小提琴图violinplot
3.3 散点图
3.3.1两类散点图
3.3.2 散点图与小提琴图结合
3.3.3 散点图与箱线图图结合
3.4 条形图barplot
3.5 点图pointplot
3.6 countplot计数统计图
4 多层面板分类图
4.1线图
4.2 柱状图
4.3 散点图
4.4 箱线图
5 回归图
5.1 sns.regplot()
5.2 sns.lmplot()
6 分布图
6.1 直方图distplot
6.2 双变量关系图jointplot
6.3 变量关系组图pairplot
7 热度图绘制
8 Facetgrid使用方法
8.1 直方图
8.2 散点图
8.3 对比图
8.4 指定顺序画图
8.5 一些参数1
8.6 一些参数2
加载模块和数据
import pandas as pd
import seaborn as sns
import numpy as np
import matplotlib.pylab as plt
sns.set(style='whitegrid',color_codes=True)
np.random.seed(sum(map(ord,'categorical')))
np.random.seed(sum(map(ord,'regression')))
titanic=pd.read_csv('titanic.csv')
tips = sns.load_dataset('tips')
iris = sns.load_dataset('iris')
1 风格设定
1.1 sns.set_style()
()里可以填写white, dark, whitegrid, darkgrid, ticks
def sinplot():
x = np.linspace(0,14,100)
for i in range(1,7):
# sns.set_style('white')
# sns.set_style('dark')
sns.set_style('ticks') # 有尖尖
# sns.despine() #去掉上边和右边的边框
plt.plot(x,np.sin(x+i*.5)*(7-i))
sinplot()
plt.show()
输出:
Figure_1.png
1.2 sns.despine()
def sinplot():
x = np.linspace(0,14,100)
for i in range(1,7):
plt.plot(x,np.sin(x+i*.5)*(7-i))
sinplot()
sns.despine(offset=10) #图离轴的距离
# sns.despine(left=True) #隐藏左边的轴
plt.show()
输出:
Figure_1.png
1.3 不同子图,不同风格
with sns.axes_style()
()可以填white, dark, whitegrid, darkgrid, ticks
def sinplot():
x = np.linspace(0,14,100)
for i in range(1,7):
plt.plot(x,np.sin(x+i*.5)*(7-i))
with sns.axes_style('darkgrid'):
plt.subplot(211)
sinplot()
plt.subplot(212)
sns.despine()
sinplot()
plt.show()
输出:
Figure_1.png
1.4 sns.set_context()
()里可以填paper, notebook, talk, poster
def sinplot():
x = np.linspace(0,14,100)
for i in range(1,7):
# sns.set_context('paper')
# sns.set_context('talk') #线粗字大
sns.set_context('notebook',font_scale=1.5,rc={'lines.linewidth':4.5}) #font_scale指定字的大小
plt.plot(x,np.sin(x+i*.5)*(7-i))
sinplot()
plt.show()
输出:
Figure_1.png
2 调色板
color_palette()能传入任何Matplotlib,不写参数则默认颜色,可以填写muted,RdBu,Blues_r,Set1,hls,Paired
set_palette()设置所有图的颜色
2.1 色块
current_palette = sns.color_palette()
sns.palplot(current_palette) #12个色块
sns.palplot(sns.color_palette('hls',8))#8个颜色,色度比较亮
plt.show()
输出:
Figure_1.png
Figure_2.png
2.2 对比颜色块
sns.palplot(sns.color_palette('Paired',8))
plt.show()
输出:
Figure_1.png
2.3 连续颜色块
sns.palplot(sns.color_palette('Blues'))
sns.palplot(sns.color_palette('Greens_r')) #参数里可以输入数字,指定颜色的块数,_r由深到浅
plt.show()
输出:
Figure_1.png
Figure_2-1.png
light_paleete()和dark_palette()调用定制连续调色板
sns.palplot(sns.light_palette('green'))
sns.palplot(sns.dark_palette('purple'))
plt.show()
输出:
Figure_1.png
Figure_2.png
2.4 简单应用
2.4.1 sns.color_palette()----箱线图
sns.set_style('whitegrid') #dark;white;
data = np.random.normal(size=(20,8))+np.arange(8)/2 #正态分布 loc均值,scale标准差,size20行8列数据
sns.boxplot(data=data,palette=sns.color_palette('hls',8))
plt.show()
输出:
Figure_1.png
2.4.2 使用xkcd颜色来命名颜色---线图
plt.plot([0,1],[0,1],sns.xkcd_rgb['pale red'],lw=3) #lw线宽
plt.plot([0,1],[0,2],sns.xkcd_rgb['medium green'],lw=3)
plt.plot([0,1],[0,3],sns.xkcd_rgb['denim blue'],lw=3)
plt.show()
输出:
Figure_1.png
2.4.3 sns.dark_palette()---核密度估计图
x,y=np.random.multivariate_normal([0,0],[[1,-5],[-.5,1]],size=300).T
pal = sns.dark_palette('green',as_cmap=True)
sns.kdeplot(x,y,cmap=pal)
plt.show()
输出:
Figure_1.png
3 因子变量绘图
3.1 boxplot箱线图
sns.boxplot(x='day',y='total_bill',hue='sex',data=tips)
plt.show()
输出:
Figure_1.png
3.2 小提琴图violinplot
图中白点为中位数,黑色盒型范围为下四分位点到上四分位点
sns.violinplot(x='day',y='total_bill',hue='sex',data=tips,split=True) #split=True 各取一半组成一个小提琴
plt.show()
输出:
Figure_1.png
3.3 散点图
3.3.1两类散点图
有两个散点图,stripplot和swarmplot,后者可以看出分布密度的散点图
sns.stripplot(x='day',y='total_bill',data=tips) #默认jitter=True
sns.swarmplot(x='day',y='total_bill',data=tips) #防止数据太密集
sns.swarmplot(x='day',y='total_bill',hue='sex',data=tips)
plt.show()
输出:
Figure_1.png
Figure_2.png
Figure_3.png
3.3.2 散点图与小提琴图结合
sns.violinplot(x='day',y='total_bill',data=tips,inner=None)
sns.swarmplot(x='day',y='total_bill',data=tips,color='w',alpha=0.5) #alpha透明度
plt.show()
输出:
Figure_1.png
3.3.3 散点图与箱线图图结合
sns.boxplot(x='day',y='total_bill',data=tips,whis=np.inf)#whis是否显示离群点,这里不显示
sns.swarmplot(x='day',y='total_bill',color='black',data=tips)
plt.show()
输出:
Figure_1.png
3.4 条形图barplot
sns.barplot(x='Sex',y='Survived',hue='Pclass',data=titanic)
plt.show()
输出:
Figure_1.png
3.5 点图pointplot
点图 描述差异性
sns.pointplot(x='Sex',y='Survived',hue='Pclass',data=titanic)
plt.show()
sns.pointplot(x='Pclass',y='Survived',data=titanic,
palette={'male':'g','female':'m'},
markers=['^','o'],linestyles=['-','--'],hue='Sex')
plt.show()
输出:
Figure_1.png
Figure_2.png
3.6 countplot计数统计图
sns.countplot('Pclass',data=titanic)
plt.show()
输出:
Figure_1.png
4 多层面板分类图
4.1线图
sns.factorplot(x='day',y='total_bill',hue='smoker',data=tips)
plt.show()
输出:
Figure_1.png
4.2 柱状图
sns.factorplot(x='day',y='total_bill',hue='smoker',data=tips,kind='bar')
plt.show()
Figure_1.png
4.3 散点图
sns.factorplot(x='day',y='total_bill',hue='smoker',data=tips,kind='swarm',col='time')
plt.show()
输出:
Figure_1.png
4.4 箱线图
sns.factorplot(x='time',y='total_bill',hue='smoker',data=tips,kind='box',col='day',size=4,aspect=0.5)#长宽比大小
plt.show()
输出:
Figure_1.png
5 回归图
sns.lmplot()和sns.regplot()
5.1 sns.regplot()
sns.regplot(x='size',y='tip',data=tips,x_jitter=0.5,color='g',marker='+') #size的取值比较固定,可以让数据小范围浮动
plt.show()
输出:
Figure_1.png
5.2 sns.lmplot()
···
sns.lmplot(x='total_bill',y='tip',row='sex',col='time',data=tips,size=3)
plt.show()
···
6 分布图
6.1 直方图distplot和核密度曲线
直方图distplot(默认hist=False)和核密度曲线(默认rug=True)
np.random.seed(0)
x = np.random.normal(size=100)
sns.set_style('whitegrid')
sns.distplot(x,bins=20,color='g')
plt.show()
输出:
Figure_1.png
6.2 双变量关系图jointplot
sns.jointplot(x='total_bill',y='tip',data=tips)
plt.show()
输出;
Figure_1.png
通过kind参数可以拟合直线,拟合核密度图
sns.jointplot(x='total_bill',y='tip',data=tips,kind='reg')
plt.show()
输出:
Figure_1.png
使用六角形代替点,分辨哪个地方数值多
sns.jointplot(x='total_bill',y='tip',data=tips,kind='hex',color='k')
plt.show()
输出:
Figure_1.png
6.3 变量关系组图pairplot
绘制dataframe中各个变量两两之间的关系图
iris = sns.load_dataset('iris')
sns.pairplot(iris)
plt.show()
输出:
Figure_1.png
分组的变量关系图,挺好看
sns.pairplot(iris,hue='species')#不同的组可以用不同的形状标记markers=['o','s','D']
plt.show()
输出:
Figure_1.png
对角线可以绘制别的图
sns.pairplot(iris,diag_kind='kde')
plt.show()
输出:
Figure_1.png
7 热度图绘制
数据的变动用颜色表示出来,比如变量之间相关程度
np.random.seed(0)
uniform_data=np.random.rand(3,3)
print(uniform_data)
heatmap=sns.heatmap(uniform_data)
plt.show()
输出:
[[0.5488135 0.71518937 0.60276338]
[0.54488318 0.4236548 0.64589411]
[0.43758721 0.891773 0.96366276]]
Figure_1.png
可以设置最大值最小值
ax=sns.heatmap(uniform_data,vmin=0.2,vmax=0.5)
plt.show()
输出:
Figure_1.png
可以设置中心值
nurmal_data=np.random.randn(3,3)
print(nurmal_data)
ax=sns.heatmap(nurmal_data,center=0)
plt.show()
输出:
[[ 1.76405235 0.40015721 0.97873798]
[ 2.2408932 1.86755799 -0.97727788]
[ 0.95008842 -0.15135721 -0.10321885]]
Figure_1.png
进行一些参数设置
flights=sns.load_dataset('flights')
print(flights.head())
flights=flights.pivot(index='month',columns='year',values='passengers') #制成透视表
print(flights)
ax = sns.heatmap(flights,annot=True,fmt='d',linewidths=0.5)#annot标注数字,fmt字体,linewidths加线格,cmap调色板
plt.show()
输出:
year month passengers
0 1949 January 112
1 1949 February 118
2 1949 March 132
3 1949 April 129
4 1949 May 121
year 1949 1950 1951 1952 1953 ... 1956 1957 1958 1959 1960
month ...
January 112 115 145 171 196 ... 284 315 340 360 417
February 118 126 150 180 196 ... 277 301 318 342 391
March 132 141 178 193 236 ... 317 356 362 406 419
April 129 135 163 181 235 ... 313 348 348 396 461
May 121 125 172 183 229 ... 318 355 363 420 472
June 135 149 178 218 243 ... 374 422 435 472 535
July 148 170 199 230 264 ... 413 465 491 548 622
August 148 170 199 242 272 ... 405 467 505 559 606
September 136 158 184 209 237 ... 355 404 404 463 508
October 119 133 162 191 211 ... 306 347 359 407 461
November 104 114 146 172 180 ... 271 305 310 362 390
December 118 140 166 194 201 ... 306 336 337 405 432
Figure_1.png
8 Facetgrid使用方法
8.1 直方图
g = sns.FacetGrid(tips,col='time') #输入数据、col、row、hue等
g.map(plt.hist,'tip') #要画的图、x、y
plt.show()
输出:
Figure_1.png
8.2 散点图
g = sns.FacetGrid(tips,col='sex',hue='smoker')
g.map(plt.scatter,'total_bill','tip',alpha=0.7)#透明程度
g.add_legend() #标签
plt.show()
输出:
Figure_1.png
8.3 对比图
一般对比图
g=sns.PairGrid(iris)
g.map(plt.scatter)
plt.show()
输出:
Figure_1.png
设置对角线和非对角线图
g=sns.PairGrid(iris)
g.map_diag(plt.hist)
g.map_offdiag(plt.scatter)
plt.show()
输出:
Figure_1.png
分组绘图
g=sns.PairGrid(iris,hue='species')
g.map_diag(plt.hist)
g.map_offdiag(plt.scatter)
g.add_legend()
plt.show()
输出:
Figure_1.png
只选取两个变量
g=sns.PairGrid(iris,vars=['sepal_length','sepal_width'],hue='species')
g.map(plt.scatter)
g.add_legend()
plt.show()
输出:
Figure_1.png
g=sns.PairGrid(tips,hue='size',palette='PuBuGn_r')
g.map(plt.scatter,s=50,edgecolor='white')
g.add_legend()
plt.show()
输出:
Figure_1.png
8.4 指定顺序画图
from pandas import Categorical
ordered_days = Categorical(['Thur','Fri','Sat','Sun'])
g = sns.FacetGrid(tips,row='day',row_order=ordered_days,size=1.7,aspect=4)
g.map(sns.boxplot,'total_bill')
plt.show()
输出:
Figure_1.png
8.5 一些参数1
pal=dict(Lunch='seagreen',Dinner='grey')
g=sns.FacetGrid(tips,hue='time',palette=pal,height=5,hue_kws={'marker':['^','v']})
g.map(plt.scatter,'total_bill','tip',s=100,alpha=0.7,lw=0.5,edgecolor='white') #s:点的大小 ,edgecolor='white':点的外边线
g.add_legend()
plt.show()
输出:
Figure_1.png
8.6 一些参数2
sns.set_style('white')
g=sns.FacetGrid(tips,row='sex',col='smoker',margin_titles=True,height=2.5)
g.map(plt.scatter,'total_bill','tip')
g.set_axis_labels('total_bill($)','tip($)')
g.set(xticks=[10,30,50],yticks=[2,6,10])
g.fig.subplots_adjust(wspace=.02,hspace=.02) #子图之间的距离
plt.show()
输出:
Figure_1.png
网友评论