美文网首页GWAS群体遗传学
10.GWAS:LD decay(LD衰减)—— PopLDde

10.GWAS:LD decay(LD衰减)—— PopLDde

作者: Wei_Sun | 来源:发表于2022-02-13 02:20 被阅读0次

关于连锁不平衡的详细介绍在之前的帖子里有说过,这里就不再赘述,本篇主要介绍LD decay的计算。
1.GWAS:原理与目的 - 简书 (jianshu.com)

LD衰减(LD decay):指位点之间由连锁不平衡到连锁平衡的演变过程,能够很好的反映连锁不平衡程度。

PopLDdecay是一款基于VCF文件,快速、高效计算连锁不平衡的工具。


流程图

相比于 PLINK 和 Haploview,PopLDdecay 的优点如下:

  • 支持直接读取 VCF 文件;
  • 输出文件非常节省空间;
  • 计算时间相对较短;
  • 支持 subgroup 的分析。

论文:
https://academic.oup.com/bioinformatics/article/35/10/1786/5132693

1.下载安装

1.1 下载地址

官网:https://github.com/BGI-shenzhen/PopLDdecay
论文:https://academic.oup.com/bioinformatics/article/35/10/1786/5132693

1.2 安装

$ git clone https://github.com/BGI-shenzhen/PopLDdecay.git 
$ cd your/path/PopLDdecay
$ chmod 755 configure
$ ./configure
$ make
$ mv PopLDdecay ./bin/

运行

$ PopLDdecay

2. 计算LD decay

2.1 vcf格式

$ PopLDdecay -InVCF  ~/vcftools_0.1.13/bin/root.id.vcf  -OutStat LDdecay

-InVCF:输入vcf文件路径及文件名
-OutStat:输出压缩文件前缀

输出文件中为LD衰减的计算结果,包括平均R2,平均D'等。


LDdecay.stat.gz

2.2 plink格式(.ped和.map)

$ perl mis/plink2genotype.pl -inPED ~/plink1.9/root12.ped -inMAP ~/sunwei/plink1.9/root12.map  -outGenotype out.genotype

-inPED:输入.ped文件路径及文件名
-inMAP:输入.map文件路径及文件名
-outGenotype:输出基因型结果,及文件名前缀


out.genotype

2.3 计算亚群的LD decay(.vcf)

准备亚群的名称清单GroupA_sample.list。

$ PopLDdecay -InVCF  ~/vcftools_0.1.13/bin/root.id.vcf -OutStat SubA_LDdecay -SubPop GroupA_sample.list

2.4 计算EHH(.vcf)

EHH (Extended Haplotype Homozygosity) : is a statistical method used to identify locations in the genome where natural selection has been occurring. EHH examines the relative occurrence haplotypes upstream and downstream of a given locus and gives a score indicating the relative similarity of uniqueness of the haplotypes of a given length.

$ PopLDdecay -InVCF  ~/vcftools_0.1.13/bin/root.id.vcf -OutStat EHH.stat.gz -EHH chr1:5154

-EHH:关注某一个SNP位点的衰减情况

3. 绘制LD decay图

软件自带一个perl的脚本,直接调用就可以,但是绘图依赖于R,需要保证环境中已经添加好R。

将上一步计算得到的LD decay结果导入,进行衰减图绘制。

3.1 全局LD decay图

$ perl  Plot_OnePop.pl  -inFile  LDdecay.stat.gz  -output  Fig

结果生成一个pdf文件,一个png文件,以及绘图用到的bin文件。


Lu, et al, 2018

3.2 多亚群LD decay图

例如一个vcf文件中,个体分为两个亚群,现在想计算两个亚群各自的LD decay,首先需要准备两个sample.list,每个list中包含一个亚群的sample ID,分别命名为subA.list和subB.list。

sample.list格式为sample ID,用空格隔开:

$ vim subA.list
  1 2 3 4 5 6 7 8 9 10
$ vim subB.list
  12 13 14 15 17 19 21 22 23 24

之后分别计算两个亚群的的LD decay:

$ PopLDdecay -InVCF  ~/vcftools_0.1.13/bin/root.id.vcf  -OutStat subA_LDdecay  -SubPop subA.list

$ PopLDdecay -InVCF  ~/vcftools_0.1.13/bin/root.id.vcf  -OutStat subB_LDdecay  -SubPop subB.list

创建一个Pop.list,包含两列,第一列为LD decay文件的路径,第二列为亚群的图例。

$ vim Pop.list
your/path/subA_LDdecay.stat.gz subA
your/path/subB_LDdecay.stat.gz subB

绘制多亚群的LD decay图:

$ perl Plot_MultiPop.pl  -inList  Pop.list  -output sub_Fig
Xu et al, 2011

参考资料:
https://mp.weixin.qq.com/s/5z28_7PGdkNuMJc8l6PFjQ

引用转载请注明出处,如有错误敬请指出。

相关文章

  • 10.GWAS:LD decay(LD衰减)—— PopLDde

    关于连锁不平衡的详细介绍在之前的帖子里有说过,这里就不再赘述,本篇主要介绍LD decay的计算。1.GWAS:原...

  • 连锁不平衡(LD)分析

    1.连锁不平衡(LD)概念 连锁不平衡(LD)是指不同位点等位基因的非随机关联。LD 的衰减是受重组率和重组代数影...

  • LD衰减距离--haploview

    可以使用haploview进行计算LD衰减值和画单倍型块图块,这个软件可以输入多种不同的文件格式:Linkage ...

  • 绘制LD衰减图

    之前使用popLDdeacy这个软件自动生成的图片不是特别好看,重新绘制了一下,记录一下。 在使用LDdecay计...

  • 2021-01-01-LD杂谈

    在重测序发表的文章里面,一般最常见的图中包含以上的LD衰减图。通常可以查看LD的距离来指导后续的单体型图以及将来的...

  • 不要犟

    LD说什么就是什么。不要犟。 即便是LD自己说要吃亏,也不要越俎代庖,否定LD,替LD着想。让LD沾光。 因为这样...

  • 一切为了LD,为了LD的家人

    一切为了LD,就是什么都要想着LD,什么都要把LD放在前面考虑。 一切为了LD,为了LD的家人、亲人、孩子、妻子。...

  • 端午节小聚

    时间:2018.06.16地点:LD home人员:部门成员+YZ+LD mother + LD classmat...

  • 和LD一块走的时候要注意的

    一是LD出门,需要自己锁门,自己要先于LD出来。 不要让LD在门口还得等你出来。 不要那么古板,非得走在LD身后。...

  • 干活要干到LD心眼里

    首先要明白LD想要什么。指导LD的目的,然后去实现。 其次,要听到、记下LD说的什么,不说的什么。要明白LD的意图。

网友评论

    本文标题:10.GWAS:LD decay(LD衰减)—— PopLDde

    本文链接:https://www.haomeiwen.com/subject/badufrtx.html