参考书:《白话统计学》
总体和样本
总体是一个或者一组对象,样本是从更发的总体中抽取的子集。
来自总体并适用于总体的值是参数
例如:
计算某大学教授的平均收入,将此大学所有教授的输入取平均值的到的就是总体的参数
还有一种方法是选取教师的子集,然后计算子集的平均收入
子集就是样本, 计算的均值是一种统计量

注意
- 总体不一定包括大量对象
- 总体的对象不一定是人
在研究时要定义总体,不管是以明确的方式或者隐含的方式
推断统计和描述统计
描述统计只应用于那些手机数据的样本对象和总体成员
推断统计 是假定样本能够代表更大的总体,然后利用样本数据得到关于总体特征的一些结论
抽样问题
随机抽样
随机抽样 随机意味着总体的每一个对象被选入样本的概率是相等的,随机抽样的好处是样本与抽样总体之间的差异不是系统性的。
典型抽样
选取在具体特征上更家符合样本的对象:
如果要研究某地成年人的平均年收入
总体就是某地的所有成年人,但是成年人又分成的很多子集,比如不同工作的占据了不同比例,如果按照这些比例抽样,15%的警察,那样本中也要班汉15%的警察
典型抽样的样本结果更能推广到总体。
方便抽样
根据参与意愿等等其他条件即方便程度来选取样本
变量类型和测量尺度
变量是所有可能被编码的东西,比如收入,年龄等等等等。
常量就是具有唯一的取值,比如样本中所有对象都是男性,那性别就是男性常量。
变量包括:
- 定量
*定性
定量就是用数字或者评分来赋值,例如身高就是一个定量变量或者连续变量,越大代表身高越高
定型赋值并不意味着特定性质的多少,比如
山东 = 1, 河南 = 2, 上海 = 3
男生 = 1, 女生 = 2
测量尺度
- 定类
- 定序
- 定距
- 定比
定类变量
使用无权重或者无符号识别变量的不同水平
比如某些研究需要探究男女之间是否有差异
男性用“0”表示, 女性用“1”表示,这里的不同类别只是标签而已,不代表优劣。
定序变量
定序变量的取值含有权重,比如富豪排名,第一的比第十的更富有
定距尺度和定比尺度
比如比较高度,因为高度的单位长度相等,比如一个人高1.65米,另一个高1.83米那就提供了行对位置和距离信息
无论是定距还是定比,用的测度的单位间距离都相等。

网友评论