美文网首页
LD衰减图

LD衰减图

作者: luly | 来源:发表于2021-10-05 15:47 被阅读0次

LD衰减距离指的是,当平均LD系数衰减到一定大小(最大值的一半/0.5以下)的时候,对应的物理距离。通常用LD衰减距离来描述LD衰减速度。LD衰减速度越快,即衰减距离越小,说明该群体遗传多样性越高;LD衰减速度越慢,通常驯化程度越高,选择强度越大,导致遗传多样性下降。
LD系数衰退速度会受到不同因素的影响而有所不同。常见的因素包括:

1)物种类型LD存在的本质是两个位点的连锁遗传导致的相关性。但这种相关性理论上会随着世代的增加、重组次数的增加而不断下降。所以,那些繁殖力强、时代间隔短的物种(例如,昆虫),其LD衰减的速度是非常快的。例如在家蚕和野蚕群体中,LD系数下降到最大值的1/2仅仅需要46bp和7bp的距离

2)群体类型相同物种的不同群体,由于其遗传背景不同,LD衰减速度也存在很大的差异。驯化选择,会导致群体遗传多样性下降,位点间的相关性(连锁程度)加强。所以,通常驯化程度越高,选择强度越大的群体,LD衰减速度是最慢的。例如,栽培稻比野生稻通常更大的LD衰减距离。类似的,自然选择、遗传漂变导致的群体遗传多样性下降,也会减慢LD衰减的速度。

3)在染色体的位置染色体不同区域的LD衰减距离而是不同的。通常着丝粒区更难重组,所以LD衰减更慢。而基因组上那些受选择的区域相比普通的区域,LD衰减速度也是更慢的。

下载软件:PopLDdecay

git clone https://github.com/BGI-shenzhen/PopLDdecay.git
chmod 755 configure
./configure

计算每个亚群的LD

~/PopLDdecay/bin/PopLDdecay -InVCF Filter.snp.vcf -SubPop 1-population.txt -OutStat p1.stat -MaxDist 1000
~/PopLDdecay/bin/PopLDdecay -InVCF Filter.snp.vcf -SubPop 2-population.txt -OutStat p2.stat -MaxDist 1000
~/PopLDdecay/bin/PopLDdecay -InVCF Filter.snp.vcf -SubPop 3-population.txt -OutStat p3.stat -MaxDist 1000
~/PopLDdecay/bin/PopLDdecay -InVCF Filter.snp.vcf -OutStat all.stat -MaxDist 2000
#-SubPop 群体ID信息,一行一个ID
#-OutStat 输出文件
#-MaxDist 两个SNP间的最大距离,默认是300kb,最大不超过5mb

创建draw.list

#上一步生成的文件的绝对路径 以及去掉后缀的文件名
/home/ug0797/data/test-fst/test2/p1.stat.gz p1
/home/ug0797/data/test-fst/test2/p2.stat.gz p2
/home/ug0797/data/test-fst/test2/p3.stat.gz p3

画图

~/PopLDdecay/bin/Plot_MultiPop.pl -inList draw.list -output draw -bin1 5000 -bin2 50000
# -bin1 -bin2设置的大一点,曲线会更平滑!
image.png

发现不止1000kb

用ggplot画

用poplddecay画图时会返回有以下内容的文件,前两列是画图所需的的数据


image.png

其中列名#Dist、Mean_r^2在R语言中无法识别,所以首先要改列名

修改列名(draw_p*就是poplddecay画图后生成的文件)

colnames(draw_p1)[1]<-'Dist'
colnames(draw_p1)[2]<-'Mean_r.2'
colnames(draw_p2)[1]<-'Dist'
colnames(draw_p2)[2]<-'Mean_r.2'
colnames(draw_p3)[1]<-'Dist'
colnames(draw_p3)[2]<-'Mean_r.2'

删除最后一行数据(只画到1000kb)

draw_p1 <- draw_p1[-22,]
draw_p2 <- draw_p2[-22,]
draw_p3 <- draw_p3[-22,]

添加分组信息

Group=("G1")
data1=data.frame(draw_p1,Group)
View(data1)
Group=("G2")
data2=data.frame(draw_p2,Group)
View(data2)
Group=("G3")
data3=data.frame(draw_p3,Group)

将三组数据合并

library(dplyr)
total_data<-dplyr::bind_rows(data1,data2,data3)

ggplot画图

p <- ggplot(data=total_data,aes(x=Dist/1000,y=Mean_r.2,colour=Group))+geom_line()+labs(y=expression(r^{2}),title="LD decay")+
xlab("Distance")+theme_bw()+xlim(0,1000)+ylim(0,0.6)#xlim,ylim设置轴范围
p<- p+theme(plot.title = element_text(hjust = 0.5))#使主标题居中
p

image.png

基础知识参考文章:
https://links.jianshu.com/go?to=http%3A%2F%2Fwww.omicshare.com%2Fforum%2Fthread-878-1-1.html

相关文章

  • 绘制LD衰减图

    之前使用popLDdeacy这个软件自动生成的图片不是特别好看,重新绘制了一下,记录一下。 在使用LDdecay计...

  • 2021-01-01-LD杂谈

    在重测序发表的文章里面,一般最常见的图中包含以上的LD衰减图。通常可以查看LD的距离来指导后续的单体型图以及将来的...

  • LD衰减图的理解与应用

    在群体遗传学研究中,LD连锁不平衡分析是最常见的分析内容,也是关联分析的基础。如何正确理解并且进行相关的LD连锁不...

  • LD衰减距离--haploview

    可以使用haploview进行计算LD衰减值和画单倍型块图块,这个软件可以输入多种不同的文件格式:Linkage ...

  • 10.GWAS:LD decay(LD衰减)—— PopLDde

    关于连锁不平衡的详细介绍在之前的帖子里有说过,这里就不再赘述,本篇主要介绍LD decay的计算。1.GWAS:原...

  • 连锁不平衡(LD)分析

    1.连锁不平衡(LD)概念 连锁不平衡(LD)是指不同位点等位基因的非随机关联。LD 的衰减是受重组率和重组代数影...

  • 从零学运放-0z桥式测温电路 衰减2019-11-04

    1.1桥式测温电路 2.2 衰减 传统的用运算放大器组成的反相衰减器如图四 图中VCC/2是虚地 图四 在电路中 ...

  • 不要犟

    LD说什么就是什么。不要犟。 即便是LD自己说要吃亏,也不要越俎代庖,否定LD,替LD着想。让LD沾光。 因为这样...

  • 一切为了LD,为了LD的家人

    一切为了LD,就是什么都要想着LD,什么都要把LD放在前面考虑。 一切为了LD,为了LD的家人、亲人、孩子、妻子。...

  • 端午节小聚

    时间:2018.06.16地点:LD home人员:部门成员+YZ+LD mother + LD classmat...

网友评论

      本文标题:LD衰减图

      本文链接:https://www.haomeiwen.com/subject/umhwnltx.html