加权是什么?
不同测量值乘以其对应的权重或系数。
权是指通过测量值精度的所取的权重,测量值的精度越高,权越大。
加权的目的?
为了使样本更好的反映总体特征。因为一般的调查数据都是分层等概率随机抽样,各个层代表的总体是不一样的,所以需要加权。
在什么情况下我们需要加权?
①以频数格式录入的数据需要进行加权(不是本文重点)
类似这样:
![](https://img.haomeiwen.com/i7210204/331db04f1668b198.png)
②对数据进行权重的调整时需要进行加权(本文重点)
当我们所得样本的结构与总体统计结构不同,需要用加权来消除结构偏差时;
在调查样本的某些变量或指标上,样本的代表性可能也会相对总体的实际状况过高或者过低,需要加权进行调整;
例如,实际男女比例7:3,但你问卷回收男女比例6:4,你可以通过加权让我们的结果趋向真实的结果
这种做法可以避免业务部门diss你的问卷人群结构不够有代表性的问题
1.计算加权系数
我们先把问卷回收结果和实际人群比例列出来看一下
![](https://img.haomeiwen.com/i7210204/aa541076999d204b.png)
有一定细微差异,为了让统计结果更有代表性,我们计算需要加权的系数
加权系数=问卷比例÷实际比例
![](https://img.haomeiwen.com/i7210204/caa9ad6ef85201eb.png)
2.在问卷这道题旁边插入一个新变量,将系数导入SPSS
1对应0.73;2对应1.17;3对应1
![](https://img.haomeiwen.com/i7210204/42c1e44b0857e988.png)
这一步有2种做法,我更倾向于第2种。
第1种:对购买者年龄列进行降序/升序处理,这样所有的1/2/3都是按照顺序排列的,贴入对应的系数。但这种会改变用户编号顺序,对于一些题目的处理可能会有影响。
※第2种:在excel里面实用VLOOKUP进行系数匹配,然后再贴入SPSS。不改变用户编号顺序。
以上2种操作方式均可,根据实际需要即可。
3.对系数进行加权
数据-加权个案
![](https://img.haomeiwen.com/i7210204/0aeb6afed60d4d7e.png)
选择个案加权系数,将【系数】选入频率变量
![](https://img.haomeiwen.com/i7210204/a97bedced5b835f8.png)
![](https://img.haomeiwen.com/i7210204/66296775a94fba89.png)
4.开启你的统计分析
网友评论