获取到群体的二代重测序数据后,分析的步骤和思路。此处只讲大的思路和步骤,不讲具体的每一步的命令,网上搜索对应的软件会有一堆教程。
-
使用bwa比对到参考基因组上获取bam
-
使用GATK4进行call SNP/INDEL。比对和call SNP
二代测序是否进行结构变异的鉴定,看个人需要。总体而已,二代数据鉴定结构变异,目前的各种算法都是能鉴定出一部分,短读长天生的劣势,决定了不会有很好的鉴定结果。 -
对变异进行注释(annovar或snpeff),统计各种信息. 使用snpeff注释
不利变异分析sift4g -
群体结构分析(structure、PCA、进化树分析)使用vcf构建进化树脚本vcf2tree
-
群体选择分析(计算pi(π),Dxy和Fst的值)使用pixy软件计算
或者是计算XP-CLR值
LD衰减使用PopLDdecay软件:LD 的衰减是受重组率和重组代数影响;研究 LD 的衰减可以揭示群体重组的历史,与等位基因的频率相结合,LD 衰减也可以用于检测正向选择。 -
种群历史与基因交流
有效群体数量会受到种群大小波动、雌雄数目不均、对后代贡献不均的影响,从而小于真实群体。因此我们可以从有效群体大小来推断整个种群历史过程:
比如在有效群体降低后迅速恢复说明正在遭遇瓶颈效应(驯化过程)
对于野生物种来说,有效群体的降低往往是由于气候变化
- PMSC分析需要极高的测序深度,提供突变速率与世代间隔。
- SMC++软件被更多应用于群体重测序项目中。
- treemix利用群体遗传数据计算协方差来构建最大似然树,然后根据估计值和实际值来判断基因流。
- GWAS分析
本文参考以下3篇教程
二代群体遗传与重测序(上) - 简书 (jianshu.com)
二代群体遗传与重测序(中) - 简书 (jianshu.com)
二代群体遗传与重测序(下) - 简书 (jianshu.com)
网友评论