美文网首页工作生活
7.3 两个类别变量的相关性度量

7.3 两个类别变量的相关性度量

作者: 迪丽娜扎 | 来源:发表于2019-07-03 19:52 被阅读0次

    1. φ系数:

    φ系数主要用于检验2×2列联表的相关性度量,也就是二分类变量的相关性度量。公式为\varphi = \sqrt{\frac{\chi^2}{n}}

    n为样本大小

    φ取值在0-1之间,越接近1则两者相关性越强。0代表完全独立,1代表完全相关

    2. Cramer's V系数

    计算公式:

    V= \sqrt{\frac{\chi ^2}{n \times min((r-1),(c-1))}}

    其中 χ2是用列联表算出来的拟合优度,见7.1或7.2,n是样本个数,r和c分别是两个类别的取值数

    V值也是取0-1,0表示完全独立,1表示完全相关

    3. 列联系数

    C=\sqrt{\frac{\chi ^2}{\chi ^2 + n}}

     χ2跟上面是一回事。当C=0时两个变量完全独立,但当两个变量完全相关时C也到不了1.

    相关文章

      网友评论

        本文标题:7.3 两个类别变量的相关性度量

        本文链接:https://www.haomeiwen.com/subject/xzvchctx.html