数据处理中我们总是会遇到各种问题:比如正态性检验(hist,qqplot,和shaprio-wilk检验 ),方差齐性检验(F),独立性检验(X2 或Fisher)。。这些常用的也有相应的R语言中实现,原理我们也分享过了,可是昨天的一道生统题突然间难倒了我。昨晚睡觉前想了一下,又看了一下课件原来是这样的。问我给你一个数据怎么证明服从某一个分布:例如下面的作业题?
我的思考:画个概率分布图看看,之后发现肉眼观察不清楚;之后怎么办呢?
现在思考: 记得有一种类型的题:某一个数据是不是符合孟德尔定律,用的卡方检验X2 ,换句话说,给你一个数据是不是换算比例后跟理想的数据是一样的。
课件是这样的:用的卡方检验,算出的x2值,这是有自由度n-1,查一下卡方表得到P值,大于0.05,好吧,拒绝不了H0了不是。
那么用R语言怎么做呢? 本次依据本次生统课作业为准一起看一下:
题目如下:
下面是课件的流程分析:
难道我需要将数据转换为概率吗?或者亲自算一遍理论值呢,可是有什么好的算法快速计算呢?
自己算的值再跟之前的比较,这时候进行卡方检验,可以看出来差异。
变成一个matrix数据框结构:
之后进行卡方检验:
chisq.test(z,correct = TRUE)
P<0.05,才符合卡方分布!不行的话,可能是数据不独立,样本数太少,进行先关性分析就好了。P<0.05,相关!总结:也就是通用的数据,带到一个表里面,二连表数据类似,之后再数据框中,进行卡方检验,也就是有没有差别,没差别,也即不独立,就进行相关性检验即可,模拟线性回归,验证线性回归。
网友评论