美文网首页人民广场心理想法
R语言分布的卡方拟合优度检验

R语言分布的卡方拟合优度检验

作者: Cache_wood | 来源:发表于2021-05-01 08:47 被阅读0次

    卡方拟合优度检验,用于衡量观测频数与期望频数之间的差异

    一般地,假设总体分r类A_i,i=1,2,……,r,分布假设检验问题
    H_0:p_i = P(A_i) = p_{i0},i=1,2,……,r;\\ 0< p_{i0}<r已知,且\sum_{i=1}^{r}p_{i0} = 1

    在原假设下,期望频数E_i = np_i
    假设从总体中随机抽取n个样本,并记O_i为样本中分到类中的个数,称为观测频数

    K.Pearson在原假设H_0成立下:
    \chi^2 =\sum\frac{(O_i-E_i)^2}{E_i} = \sum\frac{O_i^2}{E_i}-n \sim \chi(r-1)
    因此,在显著性水平\alpha下,拒绝域为
    W = {\chi^2 >\chi_{1-\alpha}^2(r-1)}

    总体分布律已知

    x<-c(315,108,101,32)
    chisq.test(x,p=c(9,3,3,1)/16)
    
    Chi-squared test for given
        probabilities
    
    data:  x
    X-squared = 0.47002, df = 3, p-value
    = 0.9254
    

    p-value = 0.9254>0.05,则不应拒绝原假设,孟德尔的结论是成立的。
    同理,可以先计算出\chi_{0.95}(3) =7.81>0.47

    某美发店上半年各月顾客数量如下,请问该店各月顾客数是否为均匀分布?


    x<-c(27,18,15,24,36,30)
    chisq.test(x)
    
        Chi-squared test for
        given probabilities
    
    data:  x
    X-squared = 12, df = 5,
    p-value = 0.03479
    

    总体分布律未知

    k<-0:14
    k1<-0:10
    s = 0
    x<-c(57,203,383,525,532,408,273,139,45,27,10,4,2,0,0)
    x1<-c(57,203,383,525,532,408,273,139,45,27,10,6)
    namda = sum(k*x)/sum(x)
    p = (namda**k1)*(exp(-namda))/factorial(k1)#计算出p的理论值
    p1 = 1-sum(p)
    p<-c(p,p1)
    chisq.test(x1,p=p)
    
        Chi-squared test for given
        probabilities
    
    data:  x1
    X-squared = 12.971, df = 11, p-value
    = 0.2952
    



    我们用R语言来模拟一下实际操作

    x<-c(6,11,20,8,5)
    a<-c(-Inf,14.55,14.95,15.35,15.75,Inf)
    p<-pnorm((a[2]-15.1)/0.4325)-pnorm((a[1]-15.1)/0.4325)
    for (i in 3:length(a)){
      q1<-pnorm((a[i]-15.1)/0.4325)
      q2<-pnorm((a[i-1]-15.1)/0.4325)
      p<-c(p,q1-q2)
    }
    p
    sum(p)
    chisq.test(x,p=p)
    
        Chi-squared test for given
        probabilities
    
    data:  x
    X-squared = 2.3639, df = 4, p-value =
    0.6692
    

    R语言实验结果与示例完全相同。

    相关文章

      网友评论

        本文标题:R语言分布的卡方拟合优度检验

        本文链接:https://www.haomeiwen.com/subject/rajwrltx.html