美文网首页微生物
Phage Term----噬菌体分类(一)

Phage Term----噬菌体分类(一)

作者: bcl_hx | 来源:发表于2020-03-27 14:27 被阅读0次

    1.噬菌体概述

    噬菌体是细菌的病毒。它们均能产生病毒颗粒,该颗粒由被蛋白质壳(衣壳)包围的遗传物质组成,有时中间存在脂质膜。它们的核酸可以是双链DNA(dsDNA),单链DNA,双链RNA或单链RNA。核酸还存在不同的构象,其中一些噬菌体基因组被衣壳化为单链环状分子,而另一些被衣壳化为双链线性分子。迄今为止描述的绝大多数噬菌体都能产生含有线性dsDNA的衣壳,但是即便仅考虑这些噬菌体,包装机制也十分多,进而会产生各种类型的DNA末端。

    在感染周期即将结束时,dsDNA噬菌体通常形成连环体(由一个单位的DNA连接成几个链状所成的集合体),后在包装过程中被末端酶切割,形成成熟染色体。噬菌体主要通过以下四种机制来识别自身的DNA(而不是其宿主的DNA),然后启动并终止其包装。

    (1)末端酶识别一个特定的位点,在该位点上引入交错切割(cos位点),从而产生具有粘性末端的固定DNA末端,并且该末端有5'或3'突出端。

    (2)噬菌体DNA可以识别一个固定的位置,在这个位置上,交错缺口的3’末端通过延伸合成产生直接末端重复(DTR)。

    (3)末端酶可以在特定包装位点(pac位点)上在噬菌体连环体上启动包装,当噬菌体头部填满时,在不同的位置进行后续的切割。这导致衣壳含有环状排列的基因组,其具有冗余末端,用于在注入宿主细胞后通过重组使噬菌体基因组环化。

    (4)T4-like的噬菌体使用了这种headful包装机制的一个变体,其中没有pac位点被识别,包装也是随机启动的。这些噬菌体通常会降解宿主DNA,确保只有病毒DNA被包装。

    另外还有三种不涉及连环体形成的三种不常见的包装机制。

    (1)噬菌体P2带有一个cos位点,但包装底物是环状dsDNA。

    (2)噬菌体Mu在宿主基因组中转座复制并携带宿主DNA片段作为其末端。

    (3)芽孢杆菌噬菌体phi29在其DNA末端带有共价结合的蛋白质。

    高通量测序的方法依赖于DNA的随机片段化,然后是DNA末端的修复和接头连接。在片段化过程后,每个噬菌体基因组通常出现一次天然DNA末端,而片段化产生的DNA末端沿基因组随机分布(图1)。这意味着从噬菌体末端位置开始的 reads数明显多于基因组中其他位置(含有末端的reads多)。

    file

    图1:从DNA末端开始的reads数偏差。片段化后,每个噬菌体基因组会出现一次天然末端,而片段化产生的DNA末端将落在基因组的随机位置。黑线代表噬菌体基因组、红方框代表噬菌体末端。

    2.方法

    2.1Phage Term分析

    通过把测序reads映射到参考基因组上来确定起始位置覆盖率(SPC)和每个方向的覆盖率(COV)。然后将这些值用于计算变量tau:τ= SPC/COV。可以用这个变量来确定DNA末端。

    2.1.1Cos噬菌体

    位置i的覆盖率(COVi)由位置i开始的碎片数量(SPCi)加上i之前覆盖i的碎片数量确定。对于固定的DNA末端,在末端之前是没有reads。这种情况下SPCi=COVi,τ=1。需要注意的是,根据末端的类型,即5’或3‘粘性末端,cos噬菌体会产生不同的结果。通常在测序文库制备过程中使用的末端修复酶可填充5'突出端并切割3'突出端。因此,对于3′cos噬菌体,期望值τ= 1。但是,对于5'cos噬菌体,末端修复产生重叠的末端:在右末端终止的片段被视为覆盖了左末端,反之亦然。因此,τ的期望值为0.5。

    2.1.2DTR噬菌体

    对于DTR噬菌体,样品中的N个噬菌体颗粒会发生片段化,应该有N个片段始于末端,N个片段覆盖基因组另一侧的重复序列边缘。因此,τ的期望为0.5。

    2.1.3Pac噬菌体

    对于pac噬菌体,对于样品中存在的N个噬菌体,应该在pac位置开始处有N/C片段,其中C是每个连环体的噬菌体基因组拷贝数。。在同一样本中,N个片段应覆盖pac位置。 因此,在pac位点位置,τ预计为:

    file

    噬菌体基因组拷贝数(C)通常小于10个,因此为0.1 <τ< 0.5。

    2.2噬菌体分类

    根据以下规则进行噬菌体分类:

    (1)当在两条链上都发现τ> 0.1的显著峰时,利用峰间距离来区分cos噬菌体和DTR噬菌体。目前,最大的粘性末端为噬菌体P2(cos),长19个bp,最小的DTR是噬菌体T3(DTR),长131个bp。因此将阈值设为20 bp,可以区分cos和DTR噬菌体。另外一个将噬菌体归类为DTR的标准是,DTR噬菌体的峰间覆盖率至少要比平均覆盖率高10%。如果正向末端位于反向末端的左侧,则预测归为cos的噬菌体具有5个突出端,否则,则具有3个突出端。(区分两种Cos噬菌体)

    (2)当仅在一条链上发现τ> 0.1的显著峰时,该噬菌体被认为是pac噬菌体。

    (3)未发现显著峰的噬菌体可能使用没有首选包装位点的headerful的包装机制(T4-like),也可能属于MU-like噬菌体。为了区分这两种可能性,计算一个read与宿主匹配的片段数量,另一个read与噬菌体基因组匹配的片段数量。平均而言,样品中的噬菌体被分成G / F片段,其中F是噬菌体基因组的平均片段大小,G是噬菌体基因组的大小。对于Mu-like噬菌体,在G / F噬菌体片段中,两个应该是杂交片段。因此,预期杂交片段的比例为2×(F/G)。如果杂交片段的比例至少为预期值的一半,则会归为Mu-like类。未发现杂交片段的噬菌体被归类为未知。

    3.结果

    不同的DNA包装机制会产生不同的DNA末端。当DNA末端出现在噬菌体基因组的固定位置或首选位置时,我们会在这些位置开始观察到比基因组中其他位置更多的reads(图1A)。

    3.1固定的DNA末端

    3.1.1COS噬菌体

    COS噬菌体预计在每个方向上显示单个峰,其值为0.5 <τ< 1。注意,对于带有5'突出端的cos噬菌体和带有3'突出端的cos噬菌体,预期会有不同的结果。一方面,带有5’突出端的cos噬菌体的正向峰将位于反向峰的左侧,中间的区域显示为平均序列覆盖率的两倍(图2A)。另一方面,具有3'突出端的cos噬菌体预期正向峰位于反向峰的右侧,并且其间的序列预期具有非常小的覆盖率(图2B)。


    file

    图2:COS噬菌体末端位置的序列覆盖率,确切的末端位置用红色虚线表示(红色:左;绿色:右)。

    5'cos噬菌体以Siphoviridae coliphage Lambda为例,3'cos噬菌体以HK97为例,其末端的性质见图3。包装的cos模式和其粘性序列的长度(表1)。


    file

    图3:噬菌体lambda和HK97每条链的起始位置覆盖率。

    file

    3.1.2DTR噬菌体

    带有直接末端重复(DTR)的噬菌体在每个方向上都有一个显著的峰,正向峰应该在反向峰的左侧。峰之间的区域应显示出平均序列覆盖率的两倍(图4)。以噬菌体T7为例,其末端的性质(图5)、末端的位置以及其直接末端重复的确切长度(表1)。

    file

    图4:噬菌体T7末端位置序列覆盖率。

    file

    图5:噬菌体T7每条链的起始位置覆盖率。

    3.2headful包装机制

    使用headful包装机制的噬菌体通常产生包含其基因组数个拷贝的连环体。在包装过程中,在包装位点(pac位置)进行了第一次切割,但是在噬菌体头装满后才进行后续切割,导致位置可变。τ的期望值为1/(C+1),其中C是每个连环体的噬菌体基因组拷贝数。由于包装是有方向性的,并且在包装终止时不会进行精确切割,因此仅在单个方向上会出现一个峰,这也告诉我们包装的方向。在该峰之后的区域,进行了第二次切割,覆盖率预计会略有增加,因为该区域的一部分将在许多噬菌体颗粒中出现两次。注:获得的用于确定pac位置的信号比cos噬菌体的信号弱C +1倍。

    对于这种包装机制,我们以P1噬菌体为例。P1末端性质如下(图6,图7)。

    file

    图6:噬菌体P1每条链的起始位置覆盖率。

    file

    图7:噬菌体P1末端位置序列覆盖率。

    其他噬菌体已被确定通过一种headful包装机制来包装它们的基因组,但没有首选的包装信号。包装后的噬菌体基因组以随机末端进行循环排列。这种噬菌体无法恢复信号。T4时无法检测到任何末端(图8)。

    file

    图8:噬菌体T4每条链的起始位置覆盖率。

    3.3MU-like噬菌体

    Mu-like噬菌体是温和噬菌体,可通过复制性转座扩增其基因组。在包装过程中,在宿主基因组中噬菌体末端的特定距离处进行第一次切割。然后通过headful机制进行包装,第二次切割在宿主DNA中噬菌体的另一侧进行。因此,包装好的DNA末端与宿主DNA的不同片段相对应(图S4)。

    file

    对于这种包装机制,以噬菌体Mu为例进行介绍。结果与预期相符,未找到τ值显著峰值(图9),检出2%的杂交片段,与理论预期的2.5%一致(图10)。

    file

    图9:噬菌体Mu每条链的起始位置覆盖率。

    file

    图10:Mu-like噬菌体。对于杂交片段在噬菌体基因组上可检测到一个read,而在宿主基因组上也可检测到一个read。

    本文由博客一文多发平台 OpenWrite 发布!

    相关文章

      网友评论

        本文标题:Phage Term----噬菌体分类(一)

        本文链接:https://www.haomeiwen.com/subject/qkmluhtx.html