美文网首页
Evaluation

Evaluation

作者: 睡眠相位后移的起床困难户 | 来源:发表于2018-06-06 17:49 被阅读0次

这个被问过两次,正好有个契机重新回顾下:

1.p-value解释

p-value 会条件反射0.05,即假设检验p(A|h0)(拒绝域的概率)

若p<0.05,那么可以认为是小概率事件,接受原假设。

但是若出现h0本来是正确的,但居然发生了A事件,错误地否定了h0,称之犯了第一类错误

α即显著性水平(一般取0.05),控制犯第一类错误的概率,α越小,弃真概率越小

举个例子:假设100个球99个白球1个黑球,然后一抽就抽中黑球,即若入拒绝域,推翻原假设

第一类与第二类错误

一般来说,第一类错误(弃真FN)与第二类错误(取伪FP)有conflicts

从上图看,若临界值uα小(往左移),第二类错误β变小(即阴影面积越小),第一类错误α变大

实际中,一般控制α/β在一个固定数,然后尽可能减少另一类β/α,结合实际问题:

(1)若是疾病预测,那么应该尽可能减少α,有病误判成无病尽可能小(无病判成有病则显得不那么重要)

(2)若是价格昂贵的商品不合格产品判别(不合格为1),那么应该尽可能减少β,明明是合格产品误判成不合格,代价就很大

(1)(2)问题也分别可以对应ML里的higher recall & higher precision

2.假设检验步骤:

1.设定原假设,设定h0,h1

2.根据实际情况建立统计检验量(基于正态分布的假设)

3.确定h0的否定域

实际上是我们根据统计检验量和α显著性水平,计算出临界值,和临界值作比较

3.回归假设检验本质,因为我们只能获取到样本信息,所以做假设检验,去预估实际情况,如果本身能就得到总体数据,直接根据总体做判断,也就不涉及到假设检验,不涉及显著性水平。(曾经被挖坑的教训)

相关文章

网友评论

      本文标题:Evaluation

      本文链接:https://www.haomeiwen.com/subject/ibfisftx.html