因果推断的三种干扰效应:Confounders, Mediators and Colliders
举例:
confounders
年龄同时影响【吸烟与否】和【生存率】 不同年龄组的吸烟-致死 odd不同 甚至会导致overall出现完全相反的结果这就是著名的辛普森悖论(Simpson's paradox)
mediators
税率变低了,但是税额却变高了,为什么呢?因为有【收入】这一因素作为mediator。1974-1978的通货膨胀率很高,因此收入膨胀了,税率再低也没法弥补大部分人因为被分到了更高的税收branket导致的税收增高。colliders
大学生中,勤奋程度和IQ值呈负相关 其实只是因为你condition on collider了!collider就是“大学生”这一要素。能进入大学的人要么很勤奋,要么IQ很高,要么两者都有。如果放到社会大样本里就没有这一规律。image.png
Maybe a more relevant example: If you find a certain correlation in a clinical sample, and you find the same correlation in a non-clinical sample, that doesn’t prove it’s real in the not-so-unlikely case that ending up in the clinical sample is a collider caused by the variables you are interested in.
————
其他一些非常【奇怪】的关联性
image.pngReading skills of children correlate with their shoe size. Number of storks in an area correlates with birth rate. Ice cream sales correlate with deaths by drowning.
因果推断的一篇参考文章
https://blog.csdn.net/qq_26430933/article/details/122468400
一个比较有意思的词:WEIRD
WEIRD
W:White
E:Educated
I:Industrialized
R:Rich
D:Democratic
这是西方心理学家常用的人群,很显然condition on很多不应该condition的条件。
写得有点粗略,后面再整合一下。贝叶斯网、假设检验等也是很值得思考的问题。后面再思考一下。
网友评论