美文网首页科研信息学
UMI绝对定量转录组 vs 普通转录组

UMI绝对定量转录组 vs 普通转录组

作者: ee00dc6faab7 | 来源:发表于2020-10-27 10:07 被阅读0次

2019年发表在 Nature Reviews Genetics 上的大神级综述文章“RNA sequencing:the teenage years”想必很多小伙伴已经看过了,文中综述了 RNA-seq 十年以来的发展,并介绍了转录组测序的一些新手段和新潮流。其中,UMI 绝对定量转录组测序(UMI-mRNA seq)就得到了作者的特别关注和介绍。如果你还不了解 UMI-seq 与普通转录组的区别,以及在转录组测序研究中的应用,往下看:

什么是 UMI- mRNA seq?

UMI 是“Unique Molecular Identifier”的缩写,即为分子标记,类似于我们常说的“barcode”标签,其目的是随机性地利用不同的分子标签标记和区分不同的分子[2]。图1是一个 7 nt 长度的 UMI 示意图。

图1  典型的 UMI 标记方式示意图[2]

利用唯一的随机分子标签标记的 RNA 或 cDNA 分子,在  PCR、测序乃至后续分析过程中都携带着这个独特的 UMI 标签。通过计数 UMI 的个数,我们便可以对原始的 RNA 分子进行“绝对定量”[3]。

为什么要使用 UMI- mRNA seq?

传统 RNA-seq 定量分析是存在一定缺陷的,其主要来源是建库过程中的 PCR 扩增。

图2  RNA-seq 的一般建库、测序和定量分析简述

如图2所示,在大部分文库构建过程中都需要利用 PCR 对 cDNA 文库进行扩增,以增加测序深度。然而研究人员们发现 PCR 扩增时对不同片段的偏好性是不同的,这也导致了扩增后测序分析的系统误差。之前发表的两篇文献研究了 RNA-seq 建库过程中 PCR 对片段长度和 GC 碱基含量的偏好,发现 PCR 对短片段(图3A)和 GC 含量偏低的片段(图3B)都有一定偏好性,并且造成文库片段丰度失真,对定量结果产生影响[4][5]。

图3  PCR 扩增对文库片段偏好性的影响[4][5]

上述系统误差随着 PCR 轮数增多而被放大,因而在一些起始样本量小的测序中会显得更为突出,无法真实地反应不同样本中基因或转录本的表达水平。而由于UMI- mRNA seq 是通过计数 UMI 对初始分子进行绝对定量,因而可以轻松解决这个问题。

UMI- mRNA seq 有什么优势?

首先,文献中对比了 PCR 误差对于利用普通 mRNA-seq 基于 reads 计数和 UMI 基于标记分子计数的影响。结果发现对比15个 cycle 的 PCR 和25个 cycle 的 PCR 后的测序结果,UMI-seq 可以有效消除 PCR 带来的一定误差[3]。

图4  UMI 绝对定量转录组消除 PCR 误差[3]

其次,UMI- mRNA seq 有利于提高 RNA-seq 的可重复性。发表在 Genome Biology 上的文献就发现,在利用同类细胞进行的多组 RNA-seq 时,利用 UMI 计数的基因表达定量数相关性更强[6]。

图5  对比基于 read count 和 UMI count 的基因表达定量的重复性[6]

此外,UMI 标记的聚类和相关算法,还可以用以区分 PCR 扩增错误、测序错误和真正的突变,有助于发现稀有的突变[7]。

图6  利用 UMI 聚类进行突变和测序/测序错误区分[7]

目前 UMI- mRNA seq 已经被运用到最近发表的越来越多的高分文献中,可以说是转录组学研究的一个新潮流!这么优秀的工具,正在进行转录组学研究的你也值得拥有!

诺禾 UMI-seq 

目前,诺禾致源有 UMI mRNA-seq 和 UMI Small RNA-seq 以满足大家的研究需要。

参考文献:

[1] R. Stark, M. Grzelak, and J. Hadfield, “RNA sequencing: the teenage years,” Nat. Rev. Genet., vol. 20, no. 11, pp. 631–656, 2019.

[2] S. Mangul, S. Van Driesche, L. S. Martin, K. C. Martin, and E. Eskin, “UMI-Reducer : Collapsing duplicate sequencing reads via Unique Molecular Identifiers,” bioRxiv, pp. 1–11, 2017.

[3] T. Kivioja et al., “Counting absolute numbers of molecules using unique molecular identifiers,” vol. 9, no. 1, pp. 3–7, 2012.

[4] J. Dabney and M. Meyer, “Length and GC-biases during sequencing library amplification: A comparison of various polymerase-buffer systems with ancient and modern DNA sequencing libraries,” Biotechniques, vol. 52, no. 2, 2012.

[5] D. Aird et al., “Analyzing and minimizing PCR amplification bias in Illumina sequencing libraries,” 2011.

[6] W. Chen, Y. Li, J. Easton, D. Finkelstein, G. Wu, and X. Chen, “UMI-count modeling and differential expression analysis for single-cell RNA sequencing,” pp. 1–17, 2018.

[7] R. Kou, H. Lam, H. Duan, L. Ye, N. Jongkam, and W. Chen, “Benefits and Challenges with Applying Unique Molecular Identifiers in Next Generation Sequencing to Detect Low Frequency Mutations,” pp. 1–15, 2016.

相关文章

网友评论

    本文标题:UMI绝对定量转录组 vs 普通转录组

    本文链接:https://www.haomeiwen.com/subject/tvmtvktx.html