在数据分析的时候,一般首先要对数据进行描述性统计分析(Descriptive Analysis),以发现其内在的规律,再选择进一步分析的方法。描述性统计分析要对调查总体所有变量的有关数据做统计性描述,主要包括数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据的分布、以及一些基本的统计图形,常用的指标有均值、中位数、众数、方差、标准差等等。
数据的集中趋势一般采用平均值、中位数表示。数据的离散程度一般采用方差、标准差表示。数据的分布情况一般采用直方图表示。
案例:北京房屋价格(数据文件:house_price.xlsx)
分析问题:
1)北京市政府为调控房地产价格,希望知道北京各小区房屋价格的分布,请分析房地产价格的集中趋势,并选择合适的图形呈现。
2)房地产商想知道北京各个环线房屋装修状况的对比情况,以便进行产品设计和市场拓展,计算指标并设计合适的图形呈现结果,最后给房地产商一些建议。
3)选择合适的图形反映北京各个区住宅区房屋分布情况
操作步骤:
1)基本描述统计
打开excel数据文件house_price.xlsx
选择描述统计,单击“确定”按钮。
2)直方图
根据描述统计的结果,在空白列构造间隔为0.5的等差数列作为接收区域D1:D19,最大值为9,最小值为0。
选择数据,单击“数据”选项卡,选择“数据分析”选项框中的“直方图”选项
输入区域选择房屋价格avgprice列$B$2:$B$186,接收区域选择第一步构造的接收数据,即D1:D19数据。
输出区域选择G3,勾选图表输出,然后单击“确定”按钮。
选中整个直方图,右键单击选择“设置数据系列格式”,单击“系列选项”,分类间距设为0。
备注:
1、基本概念:数据的集中趋势 离散程度 数据分布情况 透视表 直方图 柱形图 饼形图 堆积柱形图
2、数据文件下载地址:https://pan.baidu.com/s/1sl8jBJ3
欢迎关注
网友评论