统计学是研究不确定性现象数量规律性的方法论科学。
第一章 数据与统计资料
术语统计资料(statistics)是指数据值事实,如平均数、中位数、百分数和最大值等,它们可以帮助我们了解各种商务和经济状况。
统计学是搜集、分析、表述和解释数据的科学与艺术。特别是在商务和经济活动中,统计学旨在帮助管理者和决策者更好地理解商务和经济环境的变化,并作出科学、正确的决策。
1.1 统计学在商务和经济中的应用
会计:会计师事务所在对其客户进行审计时需要使用统计抽样程序。举例子应收账款金额是否真实。
财务:财务顾问们利用各种各样的统计信息指导投资。举例子股票。
市场营销:零售结账柜台的电子扫描仪正用于搜集各种市场调研用的数据。举例子POS扫描数据统计汇总后卖出,制造商关注特价销售和利用店内陈列品等促销活动的数据及报告。产品品牌经理利用促销活动统计资料,更好地理解促销活动和销售额之间的关系,这样对制订产品未来的市场营销战略大有裨益。
生产:质量管理是统计学的应用,各种统计质量管理图用于监测生产过程的产出。平均值控制图能帮助确定何时必须调整和修正生产过程。
经济:经济学家对未来的经济或某一方面的发展作出预测。
信息系统:运维计算机网络的各种性能报告。
1.2 数据
数据(data)是为了描述和解释所收集、分析、汇总的事实和数字。数据集(data set)是用于特定研究而搜集的所有数据。
个体(element)是指搜集数据的实体。世界贸易组织这个数据集中每一个国家是一个个体,该数据集就有60个个体。
变量(variable)是个体中所感兴趣的那些特征。数据集有5个变量:WTO身份、人均GDP、贸易逆差、惠誉评级、惠誉评级展望。
在一项研究中,对每个个体的每一变量收集测量值,从而得到了数据。对某一特定个体得到的测量值集合称为一个观测值(observation)。第一个观测值(亚美尼亚)的测量值集合是成员,1,1,BB-,稳定。
1.2.2 测量尺度
测量尺度决定了数据中蕴涵的信息量,并表明最适合的数据汇总和统计分析方法。
名义尺度(nominal scale):当一个变量的数据包含了用来识别个体属性的标记或名称。
顺序尺度:如果数据具有名义数据的性质,并且数据的顺序或者等级的意义明确。
间隔尺度(internal scale):如果数据具有顺序数据的所有性质,并且可以按照某一固定度量单位表示数值间的间隔。间隔数据永远是数值型的。
比率尺度(ratio scale):如果数据具有间隔数据的所有性质,并且两个数值之比是有意义的。像距离、高度、重量都用比率尺度来度量,需要有一个零值,变量取零值表示什么都不存在。
1.2.3 分类型数据和数量型数据
数据还可以进一步划分为分类型和数值型。归属于某一类别的数据称为分类型数据,可以用名义尺度也可以用顺序尺度度量。
用于表示大小或多少的数值称为数量型数据。数量型数据既可以用间隔尺度也可以用比率尺度。
分类变量(categorical variable)是用分类型数据表示的变量。
数量变量是用数量型数据表示的变量。
截面数据(cross-sectional data)是在相同或近似相同的同一时点上搜集的数据。
时间序列数据是在几个时期内搜集的数据。
1.4 描述统计
绝大多数的报纸、杂志、公司报告和其他出版物上的统计信息以读者易于理解的方式汇总和披露。将数据以表格、图形或数值形式汇总的统计方法被称为描述统计。
1.5 统计推断
总体(population):总体是在一个特定研究中所有个体组成的集合。
样本(sample):样本是总体的一个子集。
搜集总体全部数据的调查过程称为普查(census),搜集样本数据的调查过程称为抽样调查(sample survey)。
统计学的一个主要贡献就是利用样本数据对总体特征进行估计和假设检验。这一过程称之为统计推断(statistical inference)。
网友评论