挺好的推文,写的是最基本的遗传度计算流程,先存下来,待慢慢改进。"原文链接"
如文章“Genome-wide Complex Trait Analysis(GCTA)-全基因组复杂性状分析”中介绍的GCTA,是一款基于全基因组关联分析发展的分析工具,除了计算不同性状/表型间(traits)的遗传相关性外,还可以计算亲缘关系、近交系数……,下面简单介绍如何利用GCTA计算不同性状/表型的遗传相关性。
一,在Linux上安装GCTA工具:
wget http://cnsgenomics.com/software/gcta/gcta_1.92.1beta5.zip
#在Linux下下载GCTA工具`
unzip gcta_1.92.1beta5.zip
#解压GCTA工具
二、准备PLINK二进制格式文件,比如 test.fam, test.bim 和 test.bed
三、生成 test.grm.bin,test.grm.N.bin和test.grm.id 格式文件
/gcta/gcta64
--bfile
test
--autosome --``make``-grm --out
test
#生成grm格式文件,方便后面的遗传相关性分析
“/gcta/gcta64”指GCTA软件的位置
“--make-grm”指生成 test.grm.bin, test.grm.N.bin和test.grm.id 格式文件
“--out test”指输出的文件名为test
四、准备性状/表型文件,后缀为.txt格式,不需要表头,第一列为family ID, 第二列为individual ID 第三列和第四列为 phenotypes ,类似于PLINK的表型文件格式
五、计算遗传相关性
gcta``/gcta64
--reml-bivar --reml-bivar-nocove --grm
test
--pheno pheno.txt --reml-bivar-lrt-rg 0 --out
test
得到test.hsq 格式的文件
test.hsp文件内容如下:
Source Variance SE
V(G)_tr1 0.479647 0.179078 #trait 1 的遗传方差和标准误
V(G)_tr2 0.286330 0.181329 #trait 2 的遗传方差和标准误
C(G)_tr12 0.230828 0.147958 #trait 1 和 2 之间的遗传协方差和标准误 V(e)_tr1 0.524264 0.176650 #trait 1 的剩余方差和标准误
V(e)_tr2 0.734654 0.181146 #trait 2 的剩余方差和标准误
C(e)_tr12 0.404298 0.146863 #trait 1 和 2 的剩余协方差和标准误
Vp_tr1 1.003911 0.033202
Vp_tr2 1.020984 0.033800
V(G)/Vp_tr1 0.477779 0.176457
V(G)/Vp_tr2 0.280445 0.176928
rG 0.622864 0.217458 # 遗传相关性和标准误
n 3669 # 样本量
其中,rG即为我们想要的遗传相关性,0.622864 和 0.217458分别代表两个性状/表型间的遗传相关性(genetic correlation)和标准误(Stand error)
网友评论