总体 研究的所有事件的集合
样本 总体中选取的较小的集合
目标总体:正在研究的,并打算为其采集结果的群体
必须确认目标总体,才能确保样本代表总体
抽样单位 目标总体所描述的对象类型。可以是一个人,也可以是一个团队
抽样空间:抽样空间列出总体中所有的独立单位,被作为样本的基础,并不是样本本身,因为我们不会抽取样本中的所有对象。
如何形成抽样空间: 如果目标总体是所有汽车车主,那么可以采取车主花名册。
抽样空间并非总能拟定的:比如大海里面的鱼类
无偏样本 代表目标总体,具有相似特性
偏倚样本 无意/有意带入样本的某种个人偏好就是偏倚,样本与总体特性不相符,样本无法代表目标总体
偏倚的来源:
- 样本空间中条目不齐全,因此未包含目标总体中的所有对象。 如果条目没有在抽样空间中,那么也不会出现在样本中
- 抽样单位不正确。 例如抽样单位可能不是一粒粒口香糖,而是一盒盒口香糖
- 为样本选取的一个个抽样单位,没有出现在实际的样本中。比如你发了调查问卷,但是有的人没有填
- 调查问卷设计不当。问题要中性,适合每个人回答
- 样本缺乏随机性。比如在街上调查时候,可能就把死宅排除在调查范围外了。
例子
巧口公司为节庆季度限量生产了巧克力,想检验这些巧克力的品质。
目标总体:全部限量版巧克力
抽样单位:一块巧克力
抽样空间:涵盖所有的巧克力,由于是限量生产,有可能记录生产了多少种巧克力,以及对应的数量
形成样本时,确保包含所有类型的巧克力
反例
星巴吨推出了一种新的咖啡,想知道是否受欢迎。Boss让新来的实习生进行调查来验证。实习生十分乐意这个大好机会。他向友好客户免费发放咖啡,并收集他们的一些积极信息。并且借机和常驻咖啡店的一位常客-----一个很特别的女孩子搭话。
做完调查后,兴冲冲告诉Boss大家很喜欢这个咖啡,Boss很开心:“我们下个季度马上就推出这种咖啡”。
咖啡上市后,销量很不好。。。Boss最后取消了这个系列。
分析
- 只与友好客户交谈。
- 信息细节如何?是否仅仅曾经询问“咖啡味道是否不错”?还是得到了一些真实评价
- 是否把大部分时间花在常驻店里?该女孩是否影响了他的样本选择?
- 推出咖啡的季节与调查的季节不一致
如何选择样本
简单随机抽样: 重复抽样,不重复抽样
分层抽样:总体根据特性划分为类似的组,再抽样
整群抽样:比如口香糖按盒出售,用一盒糖代替一颗糖。
网友评论