美文网首页数据科学与R语言
R语言-14.2一次性筛选出高度相关自变量(相关系数与卡方检验)

R语言-14.2一次性筛选出高度相关自变量(相关系数与卡方检验)

作者: 周一ing | 来源:发表于2019-10-04 17:29 被阅读0次

与上一篇《单因素方差分析》组合,就是筛选与因变量相关,自变量不相关(最大相关,最小冗余)的原则进行降维

针对连续变量:利用相关性
选出2至26列,显著相关的自变量,cor存储了高度相关的变量对,以及对应的相关系数
cor.test()计算相关系数

cor<-data.frame(col1=1,name1=2,col2=3,name2=4,cor=5)
for(i in 2:25){
    for(j in (i+1):26){
        a<-cor.test(bdata[,i], bdata[,j], method = c("pearson"),conf.level = 0.95)
        if((a$p.value<0.05)&(abs(a$estimate)>0.6))
        {       
        ci<-c(i,names(bdata)[i],j,names(bdata)[j],a$estimate);
        cor<-rbind(cor,ci);
        }       
    }
}

针对分类变量:利用卡方检验
对2至126列,利用chisq.test()进行卡方检验

cor<-data.frame(a=1,b=2,c=3,d=4,e=5) 
for(i in 27:125){
    for(j in (i+1):126){
        car.data = table(bdata[,i], bdata[,j])
        a<-chisq.test(car.data)
        if(a$p.value<0.05){
            ci<-c(i,names(bdata)[i],j,names(bdata)[j],a$p.value);
            cor<-rbind(cor,ci); 
        }       
    }
}

相关文章

  • R语言-14.2一次性筛选出高度相关自变量(相关系数与卡方检验)

    与上一篇《单因素方差分析》组合,就是筛选与因变量相关,自变量不相关(最大相关,最小冗余)的原则进行降维 针对连续变...

  • R语言 卡方检验

    卡方检验是一种确定两个分类变量之间是否存在显着相关性的统计方法。 这两个变量应该来自相同的人口,他们应该是类似 -...

  • R语言卡方检验大全

    本文首发于公众号:医学和生信笔记 医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化。主要分享R...

  • R语言学习笔记_04

    假设检验 在R的内置函数中几乎囊括了所有常用的假设检验,常用的假设检验包括: 相关性分析包括Pearson相关系数...

  • R语言相关性的度量

    R可以计算多种相关系数,包括pearson相关系数、Spearman相关系数、Kendall相关系数、偏相关系数、...

  • R语言ggstatsplot包做T检验

    R语言用ggstatsplot包做方差分析和绘图R语言ggstatsplot包做卡方检验 单样本均值比较 1、点图...

  • R语言与统计-3:卡方检验

    R语言与统计-1:t检验与秩和检验[https://www.jianshu.com/p/ba629f6ae85d]...

  • 卡方检验

    白话统计学—卡方检验基本原理R语言实现卡方检验的替换组内两两比较等级资料的比较单向R×C列联表分析——列有序双向有...

  • 应用统计学与R语言实现笔记(番外篇三)——缺失值的相关系数分析

    昨天刚好有位同学来咨询R语言里计算相关系数的一些问题,所以来谈谈关于缺失值的相关系数分析问题,主要是在R语言中如何...

  • Fisher's exact test

    目录 适用实例 计算原理 计算实例3.1 解答过程3.2 R语言代码 Fisher精确检验和卡方检验的选择 1. ...

网友评论

    本文标题:R语言-14.2一次性筛选出高度相关自变量(相关系数与卡方检验)

    本文链接:https://www.haomeiwen.com/subject/lcjspctx.html