美文网首页孟德尔随机化
孟德尔随机化发高分SCI必备的一些基本概念及计算-MAF

孟德尔随机化发高分SCI必备的一些基本概念及计算-MAF

作者: 旅行的白山茶 | 来源:发表于2023-03-31 14:02 被阅读0次

大家好,孟德尔随机化很多人都是从TwoSampleMR包入手学习的,很多GWAS的概念如果不搞清楚,写SCI的时候容易犯一些概念性的错误,低分的杂志可能大家都很水,可能也就一笑而过了,如果想投高分的SCI ,那么可能审稿人一眼就能看出来并拒稿。所以,从这一期开始,我尝试来解释一些孟德尔随机化的基本概念及最简单的计算方式,不zhuai原理,主要是也不懂。

今天来介绍MAF(minor allele frequency,最小等位基因频率),它是指人群中第二多的等位基因频率。假设检测同一位点,检测到了A,T和C三种碱基,A出现100次,T出现80次,C出现20次,则第二多的T的等位基因频率为80/200。

从概念基本就可以看出来,MAF肯定是<0.5的,因为如果>0.5,那就不是第二多。在GWAS或者QTL文件中,经常没有MAF这一列,但是有Eaf这一列,他们之间的关系就是:如果Eaf>0.5,那么MAF=1-Eaf;如果Eaf<0.5,那么MAF=Eaf。

搞懂这个关系,代码就很简单啦。MAF=ifelse(GWAS$eaf>0.5, GWAS$eaf,1- GWAS$eaf),大概就是这么个意思。

计算这个有什么用呢?这就要从SNP的概念讲起来,简单来说,就是SNP是在人群中有一定比例出现的突变,并不是随便一个突变就叫SNP。那么进行SNP过滤的时候,这个MAF就要大于某个阈值,一般是0.01,也就是人群中1%的人存在的突变。

TwoSampleMR包中有一个函数extract_outcome_data,是提取暴露数据的,有个参数,maf_threshold这个就是MAF的阈值,取0.01就好了。

相关文章

网友评论

    本文标题:孟德尔随机化发高分SCI必备的一些基本概念及计算-MAF

    本文链接:https://www.haomeiwen.com/subject/jsehddtx.html