第4章 概率分布
4.7 假设检验(下):系统性偏差是怎么回事
➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖
️4.7 假设检验(下):系统性偏差是怎么回事?
️假设检验有很多“坑”,用不好就会掉到“坑" 。
️忽视小概率事件️️
✨假设检验这个方法本身就是有瑕疵的。 ✨用来假设检验的, 只是一些个别的样本。
(比如女士品茶的故事。)
➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖
️导致系统性偏差️️
️大家都是一看方法没问题,就相信了。这就叫系统性偏差。(比如邮件推荐股票的骗局。)
️对于很多号称有重大发现的单一试验的结论,科学家之所以会先存疑,然后再分头去重现、去验证,其实就是这个原因 。➡️孤证不立,一次试验可能有很大的偶然性,只有很多试验都验证了某个结论,我们才能相信它。
️ 严谨的科学论文中一般不说“我们证明了什么",而是说“我们认为什么有统计的显著性”。(用实验数据说话,去证明这个现象的显著性。)
️显著性水平的设置要和问题联动,依领域而定。️️
️如果在该严的领域放宽了标准,或者在该松的领域设置了过严的标准,就可能产生一些问题。
➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖
️用错分布导致错误结论
️比如,一般假设检验只用于正态分布,如果一个随机事件明明不符合正态分布,却偏要用假设检验,结论当然会出错。
️即使都是正态分布,用不对数据也一样会错。️️
✨比如,明明是菲律宾人的身高问题,你却拿出亚洲人的身高分布数据做比较,或者拿出菲律宾人的身高分布数据做比较,结里当然也是错的。
️想要把假设检验用好,还得选对分布才行。用错了分布,结果必然是毫无意义的。(所以,假设检验时要选对分布。)
网友评论