美文网首页
谈基于随机引物的单细胞测序较传统技术的优势

谈基于随机引物的单细胞测序较传统技术的优势

作者: 生信宝库 | 来源:发表于2023-09-20 07:47 被阅读0次

说在前面

正如大家目前所经历的,各行各业都在疯狂内卷,当然单细胞测序技术也不除外。不过从科学进步的角度来看,内卷(竞争)是促进高新技术产生的最大驱动力,因此单细胞测序行业的内卷促生了各种迭代更新的技术。今天,Immugent要给大家介绍的就是目前国产的一些基于随机引物设计理念的单细胞测序平台,以及它们相较于传统单细胞测序技术的应用方向。

说到单细胞测序平台,首先不得不提的就是老大哥10x Genomics了,然而这种商业化最为成功的平台却有着自身的短板,那就是其基于ployA尾的基因捕获技术,加上二代测序的读长有限,只能覆盖基因3‘或5’端的很小一部分片段。即使目前也已经有公司提出使用三代测序代替二代测序的做法,但是由于三代测序费用昂贵,加上准确率并不如二代测序,因而注定无法全面推广。因此,下面就说到了今天的重点:基于随机引物的设计理念来实现对基因全长的覆盖。

目前国内主要有两家公司基于随机引物的设计理念推出了自己的产品,一家是位于杭州的跃真生物,及其推出的M20 Genomics平台;另一家就是位于北京的寻因生物,及其推出的scFAST-seq平台。因为Immugent目前对M20 Genomics了解的不多,而身边很多朋友包括自己都使用过scFAST-seq进行测序。因此,本篇推文将主要以scFAST-seq测序技术为主线进行讲解。


主要内容

说到scFAST-seq平台,Immugent在之前的一篇推文:scFAST-seq:国产单细胞测序平台之光中,已经介绍过很多它的创新之处,这里就不做过多的赘述了。总体来说,scFAST-seq平台基于随机引物的设计理念,可以在单细胞水平捕获更多的ncRNA和更全面的基因转录信息,以方便我们更精准的做共突变以及可变剪切分析,下面Immugent也就分别从以上几点做重点介绍。

优势一:非编码基因的解析

众所周知,不同于能编码蛋白的基因,很多非编码RNA(ncRNA)均不具有ployA尾结构;而且后者主要是从DNA直接转录并通过不同剪切而来。因此,基于随机引物的基因捕获手段能捕获到更多的ncRNA。鉴于目前越来越多的研究表明ncRNA的功能非常多样,且在各个生理和病理状态下均发挥重要作用,那么在单细胞水平分析ncRNA的功能是非常有意义的。

ncRNA是基因转录产物的主要组成部分,且种类繁多。直到最近,人类中已经报道了270,044个lncRNA,但该数据库仍在迅速扩大。scRNA-seq是检测短寿命、细胞类型特异性lncRNA的理想技术,这些lncRNA以前在RNA-seq批量数据中被忽视。特别是scRNA-seq/snRNA-seq在发现核保留lncRNA方面具有独特的优势,这些lncRNA在bulk水平测序时可能会被大量RNA-seq产生的细胞质mRNA所稀释。

image.png

除了lncRNA的表达,对lncRNA调控的研究还可以识别可能调控目标lncRNA表达的转录因子(TFs)以及与此调控相关的顺式调控元件。基于单细胞测序数据的GRN分析是一种新兴的、强大的方法,可以解剖某些细胞类型中lncRNAs的新生物学功能。

说到在单细胞水平研究ncRNA功能的文章,不得不提的就是在2021年发表在PNAS上的一篇文章:Single-cell quantification of a broad RNA spectrum reveals unique noncoding patterns associated with cell types and states。这项研究的作者也是首先提出基于传统的单细胞测序技术无法捕获到足够量的ncRNA,于是使用了可以检测基因全长的Smart-seq技术对人原代成纤维细胞、HEK293T和MCF7细胞进行了测序,最终揭示了一些独立的类短ncRNA可以用来鉴定多种未知的细胞类型。

image.png

不过这里值得一提的是Smart-seq虽然很好,测序深度很足,但是通量很低。最近刚出的Smart-seq3测序技术在通量上虽然提升了很多,但是价格昂贵,也没有普及,所以目前可能基于随机引物的单细胞测序手段是较为合适的。

说到单细胞水平研究ncRNA的文章,还有一篇去年发表在Nature Genetics杂志上的一项研究不得不提。这项研究使用等位基因敏感的单细胞RNA测序,证明了与mRNAs相比,lncRNAs在两次转录爆发之间的持续时间是mRNAs的两倍。此外,研究人员观察到lncRNA表达的细胞间变异性增加,这是由于较低频率的爆发产生了更多的RNA分子。利用异步生长细胞的异质性,研究人员鉴定并通过实验验证了具有细胞状态特异性功能的lncRNAs,这些功能涉及细胞周期进程和细胞凋亡。

image.png

最后,研究人员确定了具有顺式功能的lncRNAs,并发现这些lncRNAs的敲低可以调节附近蛋白质编码基因的转录爆发频率或大小。总之,这项研究确定了lncRNAs的不同转录调控,并证明了lncRNAs在调节mRNA转录爆发中的作用。

说到这,就先小小的总结一下在单细胞水平研究ncRNA的优势。首先就是目前大家对编码蛋白的基因研究很多了,大部分有功能的基因多少都被报道过了,那么找到一些具有功能的新ncRNA不失为一种更好的选择。此外,就像上一篇NG中的思路,研究在一个重要的生物学事件过程中ncRNA的调控机制,从而可能有助于解释重要的生物学事件。

优势二:基因共突变分析

内源性突变过程的识别和表征深化了我们对于癌症基因组的认识,促进了基因组不稳定性不同等级癌症的预后和治疗。突变过程通常是通过全基因组测序推测而来的。导致人类癌症基因组不稳定性中细胞间拷贝数改变是如何驱动基因组和表型变异,基于传统bulk水平的测序检测到的突变往往都是突变频率很高的基因,进而促进癌症的发生和进化的仍不得而知。因此,为了准确检测低频的体细胞突变,如正常细胞群体中的体细胞突变,在单个细胞水平检测基因突变无疑是更好的选择。

说到在单细胞水平检测癌症突变的研究有很多,但比较早且有影响力的一篇是在2020年发表在Nature上的篇名为:Single-cell mutation analysis of clonal evolution in myeloid malignancies的研究。该研究通过对123例患者的146份样本进行了单细胞突变分析,发现AML是由少数克隆控制的,这些克隆经常在表观遗传调节中隐藏共同发生的突变。相反,信号基因的突变经常在不同的亚克隆中发生不止一次,这与不断增加的克隆多样性一致。

image.png

研究者通过给每个样本都绘制克隆轨迹,发现协同促进克隆扩展和优势的突变组合。同时还将蛋白表达与突变分析相结合,利用免疫表型绘制体细胞基因型和克隆结构。这一发现为了解骨髓转化的发病机制以及克隆复杂性如何随着疾病进展而演变提供了见解。

无独有偶,同年在Nature communications杂志上也发了一篇文章,同样是做的髓系白血病的单细胞突变研究。作者利用他们生成的单细胞数据,研究人员发现了往往同时存在的驱动突变以及相互排斥的突变(共突变),并开始梳理某些突变的进化史。通过一组纵向样本,他们进一步观察了克隆结构如何因不同的治疗方法而改变,表明单细胞分析有望为治疗决策提供依据。

image.png image.png

其实简单读一下这两篇文章就能发现,两者的思路非常相似,而且着手的角度也都是找克隆进化。然而一个发了正刊,另一个却发了子刊,就是因为差了不到半年的时间。因此,面对现在竞争激烈的科研环境,时间才是最宝贵的,很有可能你现在正在做的课题有别人也在做!

时间来到近两年,仍然有在单细胞水平研究突变的文章,如去年同样是在Nature杂志上就发表了一篇题为:Single-cell genomic variation induced by mutational processes in cancer的研究。这项研究将大队列的单细胞全基因组测序(WGS)和单倍型特异性分析应用于具有实验诱导的同源重组缺陷(HRD)相关基因组不稳定性的体外细胞系,以及由结构变异(SV)相关突变过程定义的人类乳腺和卵巢肿瘤。研究揭示癌症基因组中细胞间变异的三个来源,对解释表型多样性和具有基因组不稳定癌症的进化选择具有意义。

image.png

不说别的,这篇文章无论从研究深度上还是从解决的问题上都要比2020年的那两篇要高很多,这也暗示着这个领域的竞争激烈。但是对于目前在单细胞水平研究肿瘤突变这个问题来说,新型的单细胞测序手段肯定会有新的发现。scFAST-seq据说能在单细胞水平同时检测基因突变+表达谱,定位共突变基因发生的细胞类型,为肿瘤单细胞层面的共突变研究带来全新的解决方案,如果有条件的小伙伴就别再犹豫啦。此外,还有一点需要注意的是研究基因突变最好是基因组联合转录组才有意义,这对在单细胞水平的研究也是一样。

优势三:单细胞可变剪切分析

说到可变剪切,可能大家就没有对前两个概念那样熟悉了。因此,Immugent首先来介绍一下何为可变剪切:

可变剪接(alternative splicing),在真核生物中是一种非常基本的生物学事件。即基因转录后,先产生初始RNA或称作RNA前体,然后再通过可变剪接方式,选择性的把不同的外显子进行重连,从而产生不同的剪接异构体(isoform)。这种方式,使得一个基因可产生多个不同的转录本,这些转录本分别在细胞/个体分化发育的不同阶段,在不同的组织中有各自特异的表达和功能,从而极大地丰富了编码RNA和非编码RNA种类和数量,进而增加了转录组和蛋白质组的复杂性。

image.png

此外,需要注意的是除了编码蛋白的基因可以发生可变剪切之外,非编码基因也能发生可变剪切。但是说实话,Immugent觉得之前在bulk水平研究可变剪切是有点扯淡,因为每个细胞发生的可变剪切是不同的,而在bulk数据中找到可变剪切之间的联系可能发生在不同细胞。

传统针对bulk转录组测序数据开发的可变剪接分析软件,因主要考虑了多细胞测序数据的特点,所以可能不完全适用于单细胞转录组测序数据。但是,传统单细胞转录组测序存在一定的技术局限性,所以其数据中通常含有较高的噪音。因此,目前已经有一些专门针对单细胞测序数据开发的可变剪接分析软件,下面我们就介绍比较广泛使用的两款用于分析单细胞数据中可变剪切的工具。

事实上,早在2017年就有研究者使用单细胞测序技术(C1,Fluidigm)研究神经元细胞分化中的可变剪切事件,文章发表在Molecular Cell杂志上,算一个中规中矩的研究。在这项研究中,作者为了克服当时单细胞测序技术的不足,开发了一种专门用于在单细胞水平计算可变剪切事件的方法--Expedition。

image.png

这项研究提供了一个计算框架,在单细胞水平上对AS的复杂性进行反褶化。而且在这项研究中作者就提出,Expedition可应用于以连续变量分布为代表的其他日益流行的数据类型(包括但不限于RNA编辑、伪尿苷和n6 -甲基腺苷等核苷酸修饰、替代聚腺苷位点和聚亚尾长度),其均能提供先进的分析策略,以达到在单细胞分辨率下描述和分析这些分子特征。

说到第二款软件--SpliZ,可是在上一个软件上做了极大的改善,其通讯作者也是大名鼎鼎的Julia Salzman,对应文章也于2022年发表在Nature Methods杂志上。SpliZ是一种无需基因注释的统计方法,用于检测单细胞转录组测序中具有调节功能的可变剪接事件。作者将 SpliZ 应用于人类肺细胞,发现了数百个具有细胞类型特异性剪接模式的基因,其中包括对基础生物学和转化生物学具有潜在影响的基因。

image.png

虽然目前在科研界有“技术不够,算法来凑”的说法,但是要想从根本上得到在单细胞水平较为准确的揭示可变剪切事件,还需要对单细胞测序技术进行升级。从这点来看的话,基于随机引物的单细胞测序手段才是目前在单细胞水平研究可变剪切一个较为优质的选择了。

优势四:病毒转录本检测

以上三点,就是Immugent对目前基于随机引物设计的单细胞测序平台在多个方向课题应用思路的解读。事实上,按照scFAST-seq的宣传来看,其还可以做到在单细胞水平检测病毒的转录本信息。因为Immugent是搞免疫的,所以能感知到感染免疫方向一直都是免疫学非常重要的研究领域,例如刚刚过去的新冠。我们知道,病毒在感染宿主细胞后可以将自己的基因组整合到被感染的细胞中,如果可以在单细胞水平检测到病毒DNA的转录信息,那么就能轻易推断出病毒感染了哪些细胞。因此,如果这个真的可以很好的实现,也是可以做很多相关课题的。

image.png

如上面这张图展示的是某细胞系在感染病毒12h(左)和24h(右)后,基于寻因生物的scFAST-seq技术检测到的病毒基因的转录情况,可以看到该平台可以很好的检测到病毒在宿主细胞中的表达情况。

image.png

不仅是在细胞系中,在病毒感染引起的肿瘤组织中,scFAST-seq仍然可以检测到病毒基因的转录信息(如上图)。基于此情形,那可以做的相关研究就很多了。如可以研究HPV病毒主要感染哪些细胞种类,以及其对多种相关肿瘤的免疫微环境的影响,转移的影响等。

值得一提的是,目前Immugent还没有见到用单细胞测序技术揭示被病毒感染细胞的功能性研究文章。或者说即使有的话,也是很少的,那么从这点看此类科学问题还是很值得投入时间和精力去做的。


展望

总的来说,基于随机引物的单细胞测序技术有以下突出的优点:在测序通量足够的情况下,既能基本达到全基因组覆盖的水平,又不像基于三代测序开发出的技术那样需要高昂的测序费用。但是同时其还存在一些缺点:虽然说是随机引物,但在实际操作中依然存在较强的转录本偏好现象;此外,理论上不代表就是事实,虽然可以说在一定程度上做到平替,但是还是没有三代测序更靠谱;最后值得注意的是,基于随机引物的单细胞测序技术对表达量较高的基因很有优势,但对很多低表达基因的检测仍然是相对困难的。

任何一项新技术最开始被投入市场都不是十分靠谱的,单细胞测序技术也不除外。但是需要注意的是能发大文章的老师一定是敢于尝试的老师,就像10x Genomics技术在2017年前后随便测一下都可以发高分文章,现在就不行了。而且还需要注意的是,技术本身没有好坏,我们需要做的就是根据自己的需求,选择在当前性价比最高,也就是最适合自己所研究科学问题的技术即可。

好啦,本期分享到这里就结束了,希望大家都能早日发大文章,我们下期再会~~

[参考文献]

[1]Zhao X, Lan Y, Chen D. Exploring long non-coding RNA networks from single cell omics data. Comput Struct Biotechnol J. 2022 Aug 4;20:4381-4389. doi: 10.1016/j.csbj.2022.08.003IF: 6.0 Q1 . PMID: 36051880IF: 6.0 Q1 ; PMCID: PMC9403499IF: 6.0 Q1 .

[2]Isakova A, Neff N, Quake SR. Single-cell quantification of a broad RNA spectrum reveals unique noncoding patterns associated with cell types and states. Proc Natl Acad Sci U S A. 2021 Dec 21;118(51):e2113568118. doi: 10.1073/pnas.2113568118IF: 11.1 Q1 . PMID: 34911763IF: 11.1 Q1 ; PMCID: PMC8713755IF: 11.1 Q1 .

[3]Johnsson P, Ziegenhain C, Hartmanis L, Hendriks GJ, Hagemann-Jensen M, Reinius B, Sandberg R. Transcriptional kinetics and molecular functions of long noncoding RNAs. Nat Genet. 2022 Mar;54(3):306-317. doi: 10.1038/s41588-022-01014-1IF: 30.8 Q1 . Epub 2022 Mar 3. PMID: 35241826IF: 30.8 Q1 ; PMCID: PMC8920890IF: 30.8 Q1 .

[4]Morita K, Wang F, Takahashi K. Clonal evolution of acute myeloid leukemia revealed by high-throughput single-cell genomics. Nat Commun. 2020 Oct 21;11(1):5327. doi: 10.1038/s41467-020-19119-8IF: 16.6 Q1 . Erratum in: Nat Commun. 2020 Nov 19;11(1):5996. Erratum in: Nat Commun. 2021 May 10;12(1):2823. PMID: 33087716IF: 16.6 Q1 ; PMCID: PMC7577981IF: 16.6 Q1 .

[5]Miles LA, Bowman RL, Delley CL, Abate AR, Manivannan M, Sahu S, Goldberg AD, Bolton KL, Zehir A, Rampal R, Carroll MP, Meyer SE, Viny AD, Levine RL. Single-cell mutation analysis of clonal evolution in myeloid malignancies. Nature. 2020 Nov;587(7834):477-482. doi: 10.1038/s41586-020-2864-xIF: 64.8 Q1 . Epub 2020 Oct 28. PMID: 33116311IF: 64.8 Q1 ; PMCID: PMC7677169IF: 64.8 Q1 .

[6]Funnell T, O'Flanagan CH, Weigelt B, Kim SH, Da Cruz Paula A, Reis-Filho JS, Martin SD, Li Y, Xu H, de Algara TR, Lee SR, Llanos VC, Huntsman DG, McAlpine JN; IMAXT Consortium; Shah SP, Aparicio S. Single-cell genomic variation induced by mutational processes in cancer. Nature. 2022 Dec;612(7938):106-115. doi: 10.1038/s41586-022-05249-0IF: 64.8 Q1 . Epub 2022 Oct 26. PMID: 36289342IF: 64.8 Q1 ; PMCID: PMC9712114IF: 64.8 Q1 .

[7]Song Y, Botvinnik OB, Lovci MT, Kakaradov B, Liu P, Xu JL, Yeo GW. Single-Cell Alternative Splicing Analysis with Expedition Reveals Splicing Dynamics during Neuron Differentiation. Mol Cell. 2017 Jul 6;67(1):148-161.e5. doi: 10.1016/j.molcel.2017.06.003IF: 16.0 Q1 . Epub 2017 Jun 29. PMID: 28673540IF: 16.0 Q1 ; PMCID: PMC5540791IF: 16.0 Q1 .

[8]Marasco LE, Kornblihtt AR. The physiology of alternative splicing. Nat Rev Mol Cell Biol. 2023 Apr;24(4):242-254. doi: 10.1038/s41580-022-00545-zIF: 112.7 Q1 . Epub 2022 Oct 13. PMID: 36229538IF: 112.7 Q1 .

[9]Olivieri JE, Dehghannasiri R, Salzman J. The SpliZ generalizes 'percent spliced in' to reveal regulated splicing at single-cell resolution. Nat Methods. 2022 Mar;19(3):307-310. doi: 10.1038/s41592-022-01400-xIF: 48.0 Q1 . Epub 2022 Mar 3. Erratum in: Nat Methods. 2022 Apr 25;: PMID: 35241832IF: 48.0 Q1 ; PMCID: PMC9089759IF: 48.0 Q1 .


相关文章

网友评论

      本文标题:谈基于随机引物的单细胞测序较传统技术的优势

      本文链接:https://www.haomeiwen.com/subject/ehvovdtx.html