“是否信仰上帝 是否内心邪恶 是否家暴 是否喜欢挖鼻屎……(真的有这么一个调查)”
我们很多时候不太会对问卷坦诚吧?
那么,在统计学上,如何筛选识别出为了政治正确的违心做答来确认统计数据真实~
不匹配计数法 了解一下
卓克的科学思维方法课里面讲到”美国究竟有多少无神论者“的统计,指出在哈里斯民调中,2007年没有宗教信仰的人占比16%,2013年23%。有科学家是质疑这个比例的。他们的理由是:社会气氛一直以来,就是不鼓励人们说出自己不信上帝这样的话的。尤其是在从前的年代,这样说出话的人都是被唾弃的,所以填写调查问卷并不能真正挖出那些无神论者,他们长期养成的习惯,让他们填的选项,跟生活中执行的信念,这两个是相反的。那说这话当然是有道理,但这种判断也是任何有脑子的人都能提出来的质疑。
如何解决呢,在2018年1月份《社会心理跟人格科学》这份期刊上,登出一篇文章,叫“到底有多少无神论者”。
这项调查问卷和直接回答的那种调查问卷形式很不一样,改变的形式就是为了最大程度上避免被调查者心怀芥蒂,为了政治正确,违心地做答。这种内心的防御,即便是在匿名调查的时候,也会经常出现,尤其是涉及到隐私的那些问题。 但是现在有这么一种方法来排除它,这种方法叫做“不匹配计数法”。
这方法类似于,比如说针对“你是不是曾经在超市偷过东西?”作一个调查的话,那所有参与调查的人,每人发两个色子。拿到问卷之后,自己偷偷地摇一次,当然没人知道你摇的点数到底是多少。但是规则是清晰的,就是:只有摇出10点的人才按真实的情况作答。凡是摇出其他点数的人,不论真实情况是怎么样的,都答“是”,就是都答偷过东西。
那做完这么一个小调整之后,我想大家的心都会放下来了,因为即便我真的在超市偷过东西,我摇到了10点,那我就按真实情况填“是”,偷过,就好了。
因为我知道:其他大部分人填的也都是“偷过”,没人知道我摇的点数。等我交卷了之后,即便有人看到,那上面结果写着“是”,也分不出我是因为摇到10点才写的“偷”,还是因为没摇到10点而不得不写“偷”。
这样,被调查的人的心理防线就卸下了。
而实际上,作统计的人本来就不关心到底是哪个人真的偷过东西,他也只是关心能统计出一个真实情况下,人群中偷过东西的概率,所以双方都没有损失。
那采用新的方法,这个结果是怎样的呢?
设,偷过东西的人占比 X。
承认偷过东西的人中分两部分:
一部分是真的偷过,他们是 X;
一部分是没偷,但没摇中10点必须写偷过,他们的比例是11/12(简单概率)。
两部分加和是统计问卷中 Y 的数值。
那么: Y=X+11/12
整理一下: X=12Y-11
就是问卷收上来之后,填写“Yes”的占比如果是 Y% 的话,那么在超市偷过东西的比例就是 12Y-11。
通过不匹配计数法最终统计上来的无神论者的比例是26%,这比直接调查问卷的方式正好高了一倍。
有几个感触:
1、提出一个简单的质疑,解决方法也许不复杂但是一定更高维;
2、跳出问题本身,从统计数据入手,用概率外壳保护受访者,互相尊重,各取所需;
3、科学精神本身就是:总有漏洞,总可优化
网友评论