美文网首页
## 群体遗传分析分层校正,该选用多少个PCA?

## 群体遗传分析分层校正,该选用多少个PCA?

作者: drlukun | 来源:发表于2020-02-29 16:00 被阅读0次

    https://mp.weixin.qq.com/s?__biz=Mzg2MDA2MDQzMQ==&mid=2247483869&idx=1&sn=7e6797c8c7575a86abe239e3c26cfd63&chksm=ce2d6fbdf95ae6ab46c8893737c2d5e850810153681be59315b6faa9ae238c25b932438403ac&scene=21#wechat_redirect

    原创 陈文燕 bio生物信息 2019-04-28

    关于选用多少个PCA做群体分层校正,各大期刊并没有一个统一的说法。故做了如下综述。

    1 随心所欲型,想选多少就选多少

    PCA想选多少就选多少,这个真的不是开玩笑。有文献有真相!

    比如下面文献直接选用10个PCA校正群体分层。

    Largest GWAS of PTSD (N=20070) yields genetic overlap with schizophrenia and sex differences in heritability

    比如选用前5个主成分校正群体分层。

    Accounting for Population Stratification in Practice: A Comparison of the Main Strategies Dedicated to Genome-Wide Association Studies

    比如选用前3个主成分校正群体分层。

    GWAS identifies novel SLE susceptibility genes and explains the association of the HLA region

    比如选用前2个主成分校正群体分层。

    GWAS analysis of suicide attempt in schizophrenia: Main genetic effect and interaction with early life trauma

    2 通过EIGENSTRAT软件确定显著的主成分

    通过EIGENSTRAT软件确定显著的主成分的思路是这样的:

    2.1 通过EIGENSTRAT软件计算主成分

    2.2 计算各个主成分是否有显著的统计学意义

    2.3 将P值小于0.05的主成分纳入群体分层校正中

    如下图所示,主成分1和2是显著影响群体结构的(P<0.05),做关联分析时则被纳入协变量中。

    image

    此类做法参考文献:

    GWAS Identifies Novel Susceptibility Loci on 6p21.32 and 21q21.3 for Hepatocellular Carcinoma in Chronic Hepatitis B Virus Carriers

    相关文章

      网友评论

          本文标题:## 群体遗传分析分层校正,该选用多少个PCA?

          本文链接:https://www.haomeiwen.com/subject/owaphhtx.html