美文网首页科研信息学群体遗传学
使用plink进行连锁不平衡分析

使用plink进行连锁不平衡分析

作者: 生信修炼手册 | 来源:发表于2018-07-15 13:58 被阅读0次

欢迎关注"生信修炼手册"!

plink是进行连锁不平衡分析的常用工具之一,需要两个基本的输入文件,后缀分别为ped和map。ped文件格式在之前的文章中已经详细介绍过,这里只介绍map文件。

map文件主要保存SNP位点的名称和位置信息,内容如下

1 snp1 0 1
1 snp2 0 2

共4列,每一行代表一个SNP位点,第一列代表SNP位点所在染色体的名字,第二列代表SNP位点的ID,通常是rs编号,也可以是自定义的ID;第三列代表SNP位点的遗传距离,如果没有实际数值可以用0填充;第四列代表SNP位点在染色体上的位置。

plink 进行LD分析有以下两种方式:

1. 分析指定的两个SNP位点

命令如下

plink --file test  --ld snp1 snp2

在log信息中,会输出LD分析的结果

LD information for SNP pair [ snp1 snp2 ]
   R-sq = 0.009     D' = 0.163
   Haplotype     Frequency    Expectation under LE
   ---------     ---------    --------------------
       AG          0.116            0.139
       CG          0.300            0.278
       AT          0.217            0.194
       CT          0.366            0.389
   In phase alleles are AT/CG
Analysis finished: Sat Jun 23 11:48:35 2018

给出了R2和D’ 两个值,同时还给出了不同单倍型的频率。

2. 对所有的SNP位点进行分析

命令如下:

plink --file test   --r
plink --file test   --r2

--r会直接输出所有LD分析的结果,而--r2会根据R2值对结果进行过滤。在实际分析中,SNP位点个数是非常多的,如果不进行过滤,结果文件会非常的大。过滤的参数有以下几种

  1. --ld-window
    默认值为10,这个参数限定了一个SNP位点最多和10个其他的SNP位点进行LD分析。

  2. --ld-window-kb
    默认值为1Mb, 只对距离在1Mb之内的SNP位点进行分析。

  3. --ld-window-r2
    这个参数只能和--r2参数搭配使用,默认值为0.2, 对输出结果进行过滤,只输出R2大于该参数值的LD分析结果。

输出文件为plink.ld。这个文件给出了SNP位点间的R值或者R2值,示例如下

CHR_A BP_A SNP_A CHR_B BP_B SNP_B  R
  1         1       snp1      1         2     snp2    -0.108465

通过指定--ld-snp参数,也可以只分析某个SNP位点与其他位点的连锁关系,用法如下

plink  --file test  --r2 --ld-snp snp1 --ld-window-kb 1000 --ld-window 99999 --ld-window-r2 0

以上两种方法更有优劣,第一种方法会给出D’和R2两个值,第二种方法只会给出R值;第一种方法一次只能分析两个SNP位点间的连锁关系,而第二种方法一次可以分析多个SNP位点间的连锁关系。

更多参数的用法请参考官方文档

http://zzz.bwh.harvard.edu/plink/ld.shtml

扫描关注微信号,更多精彩内容等着你!

相关文章

  • 使用plink进行连锁不平衡分析

    欢迎关注"生信修炼手册"! plink是进行连锁不平衡分析的常用工具之一,需要两个基本的输入文件,后缀分别为ped...

  • LD连锁不平衡--PopLDdecay

    在群体遗传学分析中,我们经常会碰到关于连锁不平衡的问题,当然计算连锁不平衡的软件有很多,包括plink2、hapl...

  • 群体遗传分析方法:LD,FST,eQTL

    LD(连锁不平衡):计算使用plink,FST(遗传分化指数):计算使用vcftools,可视化分为箱线图和散点图...

  • 群体遗传中基于SNP的PCA分析

    基于群体遗传中变异信息文件VCF来分析PCA 第一种方法 可以使用plink软件直接进行分析 plink --vc...

  • haploview进行连锁不平衡分析

    欢迎关注"生信修炼手册"! haploview 是基于图形界面的软件,其界面设计良好,用法简单,是进行连锁不平衡分...

  • LD衰减图的理解与应用

    在群体遗传学研究中,LD连锁不平衡分析是最常见的分析内容,也是关联分析的基础。如何正确理解并且进行相关的LD连锁不...

  • plink 进行PCA分析

    当我们进行群体分析时,获得vcf文件后,可以根据变异位点对这些样本进行PCA分析,现简单介绍 1、软件安装 2、简...

  • Haploview软件使用-连锁不平衡分析

    当位于某一座位的特定等位基因与另一座位的某一等位基因同时出现的概率大于群体中因随机分布的两个等位基因同时出现的概率...

  • 跨系统调用总结

    windows调用linux 使用putty的plink进行 linux调用windows 使用telnet+ps...

  • 9.2 GWAS:关联分析——TASSEL(GLM/MLM/CM

    TASSEL是最早出现的用于动植物关联分析的软件,还可以对进化模式以及连锁不平衡进行评估,功能非常强大,要说缺点,...

网友评论

    本文标题:使用plink进行连锁不平衡分析

    本文链接:https://www.haomeiwen.com/subject/uljppftx.html