import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt
"""
箱行图又称为盒须图、盒式图、箱线图,是一种用作显示一组数据分散情况资料的统计图。
它能显示出一组数据的最大值,最小值,中位数以及上下四分位数。
"""
data=pd.read_csv("tips.csv")
print(data.head())
"""
total_bill tip sex smoker day time size
0 16.99 1.01 Female No Sun Dinner 2
1 10.34 1.66 Male No Sun Dinner 3
2 21.01 3.50 Male No Sun Dinner 3
3 23.68 3.31 Male No Sun Dinner 2
4 24.59 3.61 Female No Sun Dinner 4
"""
#简单绘制箱线图,查看 y = total_bill 的箱线图分布
sns.boxplot(y="total_bill",data=data)
plt.show()

箱线图解释.png
#查看在不同sex下,total_bill的箱线图分布
sns.boxplot(x="sex",y="total_bill",data=data)
plt.show()

指定不同分类x.png
#查看在不同sex,time下,total_bill的箱线图分布
#hue 指定对类别进一步分类
sns.boxplot(x="sex",y="total_bill",data=data,hue="time")
plt.show()

指定不同分类的sex基础上再次分类.png
#fliersize 用于指定离群的异常值的标记的大小
sns.boxplot(x="sex",y="total_bill",data=data,hue="time",fliersize=15)
plt.show()

filersize设置异常标记的大小.png
#stripplot 画分布散点图
#x=time.y=total_bill
sns.stripplot(x="time",y="total_bill",data=data)
plt.show()

stripplot画分布散点图.png
#hue 对内部再次进行分类
sns.stripplot(x="time",y="total_bill",data=data,hue="day")
plt.show()

对分布散点图分类hue.png
#dodge=True 把组内的不同类别分开显示
sns.stripplot(x="time",y="total_bill",data=data,hue="day",dodge=True)
plt.show()

dodge对分布散点图不同分类再分类.png
#order 对x参数所选字段内的类别进行排序以及筛选
sns.stripplot(x="time",y="total_bill",data=data,hue="day",dodge=True,order=["Lunch","Dinner"])
plt.show()

order对分布散点图x参数的排序及删选.png
网友评论