1.画直方图
先从外部导入数据:
画绝对频率的直方图,在画之前先解释什么叫直方图:直方图是反应数据在某一区间内出现频率的图,例如20岁到30岁有多少人,30岁到四十岁有多少人......横坐标表示落点的区间(对应年龄),纵坐标表示人数,也就是频率,下面就是具体的函数:
edges表示划分的区间,histogram(A,B),A表示你要研究的数据库,B表示对这些数据划分的区间,效果:
因此,直方图和条形图的不同就在于,条形图反映的是自变量和因变量的数量关系,而直方图则是统计一个数据库里各个区间内对应数据的多少。
下面是相对频率的直方图:
就是在histogram括号里再写两个参数:'Normalization','Probability',这两个在这里是捆绑的。
2.计算标准差和分位点
prctile中的75表示75%,也就是3/4处,也就是四分之三分位点。
3.画箱形图
箱形图是用来反应异常值的,至于怎么反应,下次单独讲。
网友评论