美文网首页
每日paper - 20220112 - 骡鹿基因组中 CrER

每日paper - 20220112 - 骡鹿基因组中 CrER

作者: 阿芃 | 来源:发表于2022-01-12 11:15 被阅读0次

    Recombination Marks the Evolutionary Dynamics of a Recently Endogenized Retrovirus

    2021 年 12 月发表在 MBE 上。通讯作者为捷克共和国科学院分子遗传学研究所的 Mary Poss。

    研究者们之前已经确定了骡鹿中鹿科逆转录病毒 CrERV 的位置。在本研究中,研究者们对一只骡鹿进行了基因组组装,对获得的 252 个 CrERV 位点进行分析,确定了每个位点上的进化过程,包括系统发育起源、基因组位置和在群体中的频率。结果表明,CrERV 的数目和多样性在近期通过一个新的支系的水平转移大大提高。新支系的引入增大了骡鹿基因组上的 CrERV 负担,并且通过与已有的 CrERV 重组提高了 CrERV 多样性,而产生的重组病毒进入基因组、进一步在基因组上扩展。CrERV 的位置并不随机,它们显著分布在靠近基因的位置,这可能是一个重组 CrERV 支系扩展的原因。总的来说,在驼鹿中,逆转录病毒的 colonization 是一个动态的过程,同时也为宿主带来了基因组多态性。

    ERV 的来源是 XRV(外源逆转录病毒)从生殖细胞的感染、然后代际传递;ERV 也可以通过逆转录转座和再次感染在基因组上扩张。然而,在祖先物种中发生的 ERV 插入时间的进化过程很难确定。为了研究 ERV 与宿主间相互作用的动态过程,需要近期正在发生的插入事件。比如骡鹿中。研究者们的目标是,研究在近一百万年中感染了骡鹿的不同支系的 ERV 的演化动态,using the complete genome sequence of a majority of coding ERVs in the context of a draft assembly of a newly sequenced mule deer genome。

    对 CrERV 已经有了一定的研究基础。研究者们组装了一个 draft assembly 来研究 CrERV。为了能够将近期插入的 ERV 也组装进基因组,研究者们结合了高深度 illumina 短读长全基因组测序和 long-insert mate pair sequencing。一半的 CrERV 都位于 scaffold 的末端,这是因为重复单元会使得 scaffold 无法完整组装。为了确定这些 CrERV 周围的完整序列,研究者们进行了 reference-assisted chromosome assembly (RACA)。组装出了基因组并进行了注释。

    组装完之后发现在从头组装中只有 3 个有编码潜能的 CrERV 被组装了出来,组装结果只包含不到 9.62% 的重复序列。于是结合前面说到的 RACA 按不同长度的组装结果,以及 long-insert mate pair sequencing 重建了每个位置上的 CrERV。在用于组装基因组的 MT273 个体基因组上检测到了 252 个 CrERV,与平均每只骡鹿 240 个 CrERV 位点的估计相符合。这里面大部分都是有编码能力的,其余 46 个是 solo LTRs。在 206 个含有基因的 CrERV 中,164 个足够完整、能够进行系统发育分析。5' 和 3' LTR 序列之间没有序列差异,所以常用的基于 LTR 突变来研究演化历史的方法并不适用。

    研究了 CrERV alignments,发现有 34 个重建出来的 CrERV 序列上没有重组信号(如何判断?),它们能够代表 CrERV 间的系统发育结构。

    Figure 2. Coalescent phylogeny, env structural variation, and population frequency of representative full-length nonrecombinant CrERVs.

    四个支系,四次独立感染事件。各自有不同的 Env 状态。

    接下来研究了支系间的重组。通过前面的分析已经确定不同支系的特点,用这个特点对剩余的 CrERV 位点进行分析,可以判断出重组位点上下游分别是哪个支系的序列。

    Figure 3. Recombination among CrERVs.

    之后研究者们还对 CrERV 在基因组上的位置进行了分析。

    CrERV insertions are enriched within 20 kb of genes and depleted in introns.

    发现 CrERV 集中在基因附近 20kb 区域内, 并且在内含子中少见。对支系分别进行分析,发现也不是所有的支系都喜欢待在基因附近。这可能与支系的扩张有关。

    相关文章

      网友评论

          本文标题:每日paper - 20220112 - 骡鹿基因组中 CrER

          本文链接:https://www.haomeiwen.com/subject/gsibcrtx.html