美文网首页基因组
GWAS群体分层 (Population stratificat

GWAS群体分层 (Population stratificat

作者: 又是一只小菜鸟 | 来源:发表于2019-11-12 17:27 被阅读0次

    来源:https://www.cnblogs.com/chenwenyan/p/10484467.html
    感谢作者,拷过来做个笔记。

    一、为什么要做祖先成分的PCA?

    GWAS研究时经常碰到群体分层的现象,即该群体的祖先来源多样性,我们知道的,不同群体SNP频率不一样,导致后面做关联分析的时候可能出现假阳性位点(不一定是显著信号位点与该表型有关,可能是与群体SNP频率差异有关),因此我们需要在关联分析前对该群体做PCA分析,随后将PCA结果作为协变量加入关联分析中。

    二、怎么做PCA?

    简单一个“--pca”参数即可

    1plink --bfile myfile --pca 10 --out myfile_pca #这里只取前10个PCA结果,如果想取其他数值,请自行设置

    跑完以后,会生成三个文件,分别是myfile_pca.eigenval,myfile_pca.eigenvec,myfile_pca.log。
    其中,myfile_pca.eigenvec即为我们所需的PCA文件,大概长得如下:
    FID_1 IID_1 0.00126761 0.00331304 -0.0105174 0.000679466 -0.0179362 0.00672081 0.000979499 -0.00752795 0.00626333 -0.00849531
    FID_1 IID_2 -0.000272769 -0.00328075 -0.00380584 -0.00787082 0.00896386 -0.00325664 0.00241414 0.00612508 -0.000788917 -0.00188887

    三、生成的PCA结果怎么用?

    这个相当简单,直接把这堆数值加入covar文件中,只有控制了这些祖先成分的变量,才能最大限度的找到真实的信号。

    增加一篇参考推文:这个不错https://cloud.tencent.com/developer/article/1556160

    四、PCA画图

    参考这篇推文:https://www.cnblogs.com/zkkaka/p/6160963.html

    相关文章

      网友评论

        本文标题:GWAS群体分层 (Population stratificat

        本文链接:https://www.haomeiwen.com/subject/tnpqictx.html