GWAS群体分层 (Population stratificat

作者: 又是一只小菜鸟 | 来源:发表于2019-11-12 17:27 被阅读0次

GWAS群体分层 (Population stratificat
GWAS分析-PCA
一行命令学会全基因组关联分析(GWAS)的meta分析
全基因组关联分析（GWAS）-群体结构与亲缘关系
群体进化-GWAS分析
动植物重测序--全基因组关联分析GWAS
为什么要做重测序与群体遗传（前言）
为什么要做重测序与群体遗传（前言）
模型稳定性
GWAS基石---混合线性模型

来源：https://www.cnblogs.com/chenwenyan/p/10484467.html
感谢作者，拷过来做个笔记。

一、为什么要做祖先成分的PCA?

GWAS研究时经常碰到群体分层的现象，即该群体的祖先来源多样性，我们知道的，不同群体SNP频率不一样，导致后面做关联分析的时候可能出现假阳性位点（不一定是显著信号位点与该表型有关，可能是与群体SNP频率差异有关），因此我们需要在关联分析前对该群体做PCA分析，随后将PCA结果作为协变量加入关联分析中。

二、怎么做PCA?

简单一个“--pca”参数即可

1plink --bfile myfile --pca 10 --out myfile_pca #这里只取前10个PCA结果，如果想取其他数值，请自行设置

跑完以后，会生成三个文件，分别是myfile_pca.eigenval，myfile_pca.eigenvec，myfile_pca.log。
其中，myfile_pca.eigenvec即为我们所需的PCA文件，大概长得如下：
FID_1 IID_1 0.00126761 0.00331304 -0.0105174 0.000679466 -0.0179362 0.00672081 0.000979499 -0.00752795 0.00626333 -0.00849531
FID_1 IID_2 -0.000272769 -0.00328075 -0.00380584 -0.00787082 0.00896386 -0.00325664 0.00241414 0.00612508 -0.000788917 -0.00188887