美文网首页
3 显著性检验

3 显著性检验

作者: 老姚记事本 | 来源:发表于2022-01-18 14:21 被阅读0次

    3.1 p值和z值

    一般性假设检验构建拒绝域R_\alpha使得
    Pr_ 0 \{ x \in R_\alpha \} = \alpha
    对应的p值为:


    (R_\alpha是根据显著性水平\alpha构建的,而显著的p(x)则根据包含x的最小区域计算的)

    显然p(x)越小越确定存在显著差异,p值引入了更多信息。

    Fisher’s scale of evidence for interpreting p-values
    在H0下,p值服从均匀分布
    H_0:P = p(x) \sim U(0, 1)
    接下来将主要使用Z值而不是P值z(x) = \Phi^{-1}(p(x))
    H_0:z(x) \sim \mathcal N(0, 1 )
    z 值使我们能够将正态理论的力量用于解决大规模推理问题。
    DTI数据例子

    3.2 修正的p值和FWER

    FWER = Pr \{ Reject\ any\ true\ H_ { 0 i } \}
    控制流程目标FWER \leq \alpha,经典做法是Bonferroni边界p_i \leq \alpha / N
    如果我们认为这是一种p值修正,则
    \widetilde{p}_i = \{ min( Np_i, 1 ) \}
    我们通过\widetilde{p}_i来判断是否显著。
    如果x是测试数据,FWER_\alpha(x)\alpha为目标的控制流程,则
    \widetilde{p}_i(x)= inf_\alpha \{ H_{0i} \ rejected \ by\ FWER_\alpha(x) \ \}
    Holm控制过程为将p值排序后p_{(j)} \leq \frac{\alpha}{N - j + 1}
    对应修正后的p值为\widetilde{p}_i = \max_{ j \leq i }\{min((N - j + 1)p_{(j)}, 1) \}

    从修正后的p值可以明显看出,Holm过程优于Bonferroni过程。

    3.3 逐步算法

    介绍几种控制FWER的逐步算法。
    step-down过程会现将p值排序p_{(1)} \leq p_{(2)}...\leq p_{(N)}。因此如果p_{i}被拒绝,则前面的p值也都会被拒绝。Holm方法是最早的例子之一。
    通过closure principle可以将Bonferroni’s bound扩展为Holm’s procedure
    如果假设p值间独立,可以得到Simes’ inequality,当全为H0时:
    Pr \{ p_{(i)} \geq \frac{\alpha i }{N}\ for\ i = 1 ,2,..., N \} \geq 1 - \alpha
    基于Simes’ inequality,Hochberg优化Holm’s adjusted p-values为
    \widetilde{p}_i = min( min_{j \geq i} \{ (N - i + 1 ) p_{(j)} \}, 1)
    此方案要基于独立前提,它是step-up过程

    3.4 排列算法

    Bonferroni bound的好处是不用关心p值得相关性,但是如果我们已知了相关性,这就变成了劣势。Westfall和Young将相关性考虑后对Holm的过程进行了优化。
    如果将p值排序p_{(1)} \leq p_{(2)} \leq...\leq p_{(N)},用r_1, r_2,...,r_N代表原始的下标:p_{(j)} = p_{r_j}
    定义R_j = \{ r_j, r_{j+1} ,..., r_N \}(比p_{j}大的p值的原始下标集合),且
    \pi(j) = Pr_0 \{ \min_{ k \in R_j}(P_k) \leq p_{(j)} \}
    此处(P_1, P_2, ...,P_N)表示在H0(complete null hypothesis)下观测到(p_1, p_2, ...,p_N)的概率
    Westfall–Young step-down min-p定义为
    \widetilde{p}_i = \max_{j \leq i} \{ \pi(j) \}
    根据Boole’s inequality
    \pi_{(j)} \leq \sum_ {k \in R_j} Pr_0 \{ P_k \leq p_{(j)} \} = (N-j+1) p_{(j)}
    说明效果好于Holm法。
    由于p值计算相对麻烦,也可以用t值替换
    \pi(j) = Pr_0 \{ \max_{ k \in R_j} (T_k) \geq t_{(j)} \} (3.38)

    现在问题的关键是,如何计算(P_1, P_2, ...,P_N)
    带回第2章的例子,X是一个6033 * 102的矩阵,X^*是对它重排列后的矩阵。
    定义J^* = (j_1^*, j_2^*, ...,j_n^*),是一个将参加实验人员随机排列后的顺序,对应的
    x_{ij}^* = x_{iJ^*(j)}\ \ for\ \ j=1,2,...,n\ \ and \ \ i=1,2,...,N
    仍然取前50个与后52个进行计算,得到
    T^* = (T_1^*,T_2^*,...,T_N^*)
    重复上述过程B(较大的数)轮,可以得到 (3.38)的估计值
    \hat{\pi}(j) = \#\{ \max_{ k \in R_j} (T_k^*) \geq t_{(j)} \}/B
    这种评估比较科学的原因:

    • 随机排列X使计算的T来及相同的混合分布
    • 由于每次按病人随机排列,保留了基因之间的相关性


    3.5 其它控制标准

    FWER是传统多重检验控制规则,但是还有其它,比如:
    per comparison error rate: PCER = E{ 错误拒绝数 } / N
    excepcted error rate: EER = E{错误决策数(包含两类错误)} / N

    Lehmann and Romano’s k-FWER criteria是FWER的变种,目标是控制错误拒绝零假设数不超过k,当k等于1时等于传统FWER。


    相关文章

      网友评论

          本文标题:3 显著性检验

          本文链接:https://www.haomeiwen.com/subject/nqpzfrtx.html