美文网首页重测序及SNP分析
为什么要对插入或缺失周围的序列重新排列

为什么要对插入或缺失周围的序列重新排列

作者: 爱吃海椒的妹妹 | 来源:发表于2022-03-14 11:16 被阅读0次

详见视频
2015 GATK讲座 插入缺失的重新比对-科技-完整版视频在线观看-爱奇艺 (iqiyi.com)

目前新版的haplotype caller似乎不需要BQSR和indel realignment步骤,参考自科学网—WES学习笔记 - 赵加栋的博文 (sciencenet.cn)
的说法
一、目的

当序列与参考基因组进行比对时,在序列的末端时容易出错的。当比对软件错误地将序列比对到参考基因组时,插入缺失变异可能被掩盖。因此这些人为错配可能会在稍后的工作流程中,损害后面地碱基质量分数地重新校准和对变异地检测。
除非我们使用这个插入缺失变异重新比对才能减少那些错误。

二、如何重新比对:

基本原则是找到三种类型的重新比对的目标
1、看我们以前发现过的有插入缺失变异的已知位置
2、在序列比对到参考基因组过程中发现的插入缺失变异
3、有证据表明有隐藏的插入缺失变异的

因此可以通过熵计算找到这些位点,并基于寻找数量(就像一个特定区域的成簇的错配的数量)计算活动分数

image.png

三、实施方案:
两个步骤
1、在GATK中使用RealignerTargetCreator(重新比对目标生成器的工具),它在基因组中确定的目标也就是我们要重新比对的基因组范围
2、实际用IndelRealigner的软件工具做重新比对的工作


image.png

A.预处理:a.采用bam文件,
b.已知的插入缺失变异的列表
然后使用RealinerTargetCreator,生成一个intervals文件(描述我们要做重新比对的位置)

             a和b两个文件是可选的,可以其中一个,使用b文件会更快,但是可能会错过一些新的变异

B.原始bam文件 intervals文件 可能使用已知的插入缺失变异的列表
给IndelRealigner
而后输出一个bam文件

此过程的输入文件有几种可选的:
一,完全使用已知Indel的列表 很快但会错过一些变异
二,建议使用原始bam比对中看到的Indel,并且那将用到entropy measure。
三,如果你真的不能忍受错过任何潜在的变异,你可用完整的Smith-Waterman重比对方法(局部重比对) 最准确,但计算成本非常高

四、一个补充的说明.:
你可能会疑问,新版的软件是否需要这个过程?
haplotype caller有自己的重新比对过程,你可能会想,这里的重新比对步骤是否还有必要。但事实证明,流程中还有其他几个步骤,其Indel可以受到Indel realignment的影响,其中之一就是对碱基质量得分的重新校准。那么可能发生的是,这些假的SNP中的一些,可以对碱基质量分数的重新校准产生影响。
如果你仍需要传统工具,例如使用unifiedgenotyper判读变异,它仍是有用的,那么真的没有必要运行IndelRealigner.
并且对于RNA-seq,由于haplotype caller自然地处理RNA,似乎潜在地不是很有影响

相关文章

  • 为什么要对插入或缺失周围的序列重新排列

    详见视频2015 GATK讲座 插入缺失的重新比对-科技-完整版视频在线观看-爱奇艺 (iqiyi.com)[ht...

  • bam比对flag说明以及提取未必对上的reads

    flag 1 : 代表这个序列采用的是PE双端测序 2: 代表这个序列和参考序列完全匹配,没有插入缺失 4: 代表...

  • 4.1 栈与队列

    栈是受限序列,只能在栈顶插入或删除栈属于序列的特例,故可直接基于向量或列表派生 队列是受限序列,只能在队尾插入(查...

  • 数据结构与算法--排序之冒泡、选择、插入、希尔

    数据结构与算法--排序之冒泡、选择、插入、希尔 我们关注的主要对象是重新排列数组元素的算法,每个元素都有一个主键,...

  • 7 基本排序算法概述

    通过排序(Sorting)可以重新排列一个数据元素集合或序列,目的是排列成一个按数据元素某个项值排序的序列。排序是...

  • float、margin:auto、子选择器、focus、bef

    floatCSS 的 Float(浮动),会使元素向左或向右移动,其周围的元素也会重新排列。Float(浮动),往...

  • 数据结构 排序的一些基本概念

    排序概念 排序:将一个数据元素(或记录)的任意序列,重新排列成一个按关键字有序的序列。 排序定义 假设含n个记录的...

  • 回头看 之 插入排序

    原理:在给定的序列里构造子序列,将插入的元素与子序列的元素倒序比较,如果插入元素小于子序列最后一个元素,则插入,否...

  • CSS float浮动

    浮动 CSS的float属性设置HTML元素的浮动类型,设置HTML元素向左或向右移动,其周围的元素也会重新排列。...

  • 染色体结构变异SV

    SV(结构变异)指基因组水平上大片段的插入、缺失、倒置、易位等序列。 详细的生物学解释,还有图文并茂的讲述大家可以...

网友评论

    本文标题:为什么要对插入或缺失周围的序列重新排列

    本文链接:https://www.haomeiwen.com/subject/vzncdrtx.html