美文网首页GWASGWAS学习
2018-11-05 GWAS实战(六)plink 进阶之主成分

2018-11-05 GWAS实战(六)plink 进阶之主成分

作者: 小郑的学习笔记 | 来源:发表于2018-11-05 18:31 被阅读168次

    要学习这一节,首先是要学习什么是主成分,什么是聚类
    这个我一直有点搞混,可以百度谷歌查一查
    http://www.cnblogs.com/pinard/p/6239403.html
    https://www.jianshu.com/p/794e91f60170

    聚类这一块我做了,似乎结果不理想,以后参考这个http://www.cog-genomics.org/plink/1.9/strat#cluster

    这里我着重介绍如何用plink做主成分http://www.cog-genomics.org/plink/1.9/strat#pca

    PLINK 1.9 provides two dimension reduction routines: --pca, for principal components analysis (PCA) based on the variance-standardized relationship matrix, and --mds-plot, for multidimensional scaling (MDS) based on raw Hamming distances. Top principal components are generally used as covariates in association analysis regressions to help correct for population stratification, while MDS coordinates help with visualizing genetic distances.

    感觉这一块学的不是很懂,我先继续走下去,后面再来补充

    似乎如果已经定义了种群和聚类,可以在各个类中继续做PCA

    这里我先不管,继续

    plink --bfile clean --pca 5 --out clean
    

    过程如下

    pac.png

    产生两个文件
    eigenval eigenvec

    clean.eigenval.png

    这个文件是看每个主成分可以解释多少基因的变异

    clean.eigenvec.png

    这个文件是每个个体在每个主成分上的投影

    这一章的内容我是为了做EigenGWAS 做准备

    相关文章

      网友评论

        本文标题:2018-11-05 GWAS实战(六)plink 进阶之主成分

        本文链接:https://www.haomeiwen.com/subject/tfcntqtx.html