基于液滴的单细胞RNA测序(scRNA-Seq)已经从一项具有巨大潜力的技术迅速发展成为一种适用于更广泛问题的方法。事实证明,scRNA-Seq提供的详细信息在解决细胞对发育和环境提示的反应方面非常强大。然而,为了最大限度地发挥这项技术的潜力,需要考虑一系列上游的实用要点。其中主要的是优化细胞分离程序,适应生物/非生物应激反应,以及识别所需的细胞数量和测序读数。在本文中讨论了这些考虑因素并提供了一些建议。
原文链接:Crafting a blueprint for single-cell RNA sequencing - ScienceDirect
主要结果
1.The emerging power of scRNA-Seq
在高通量scRNA-Seq下观察细胞间异质性的为植物生物学中的一系列关键问题打开了一个新的视角。细胞如何经历不同的发育状态,组织在创伤后如何再生,应激反应如何表达,以及遗传变异如何影响这些过程,这些问题用单细胞转录组得到了很好的研究。一些早期的高通量scRNA-Seq应用于植物组织的研究主要集中在拟南芥初生根尖。
此外,在根尖由于其严格的时空组织,细胞类型围绕一个中心排列在同心圆中,并且沿着纵轴捕捉发育状态,因此根部很适合描述发育转变,并且提供了对分化过程,特定组织的非生物应激反应,特定细胞类型对遗传扰动的反应,以及细胞周期调节动态的独特见解,从而有力地检验了在植物中利用这项技术的优点。
Table 1. Overview of current high-throughput scRNA-Seq studies in plants2.Optimizing cell isolation
基于液滴的植物scRNA-Seq,必须首先用酶法去除细胞壁,产生原生质体,优化这一过程是至关重要的。我们的目标是找到一种在保持组织复杂性的同时,快速产生清洁细胞悬浮液的方法。不同的细胞特征应该有不同的处理方法,包括细胞密度、细胞壁厚度、细胞壁成分以及角质层、木质素或类似化合物的存在,这些因素会影响消化效果,确定酶的需要和消化时间。其他细胞特性,包括浮力(细胞下沉将使细胞捕获复杂化),对渗透压变化的敏感性(细胞破裂),以及细胞的生存能力,也将影响原生质体的制备。应用于拟南芥根的各种方案表明,这是一个相对简单的组织处理。然而,其他组织可能需要更广泛的优化,以限制消化时间,理想情况下低于1小时,并将对基因表达的不利影响降至最低。
考虑到上述因素,提出了一些优化方案。关键是酶的浓度/组成、糖基、缓冲液pH、培养温度和原生质体洗涤程序(离心和过滤)。鉴于许多组织不会很快地完全消化细胞壁,在酶解之前必须对组织进行破碎,并在酶解过程中进行物理搅拌,这对于获得原生质体可能是非常重要的。
Figure 1. Considerations and tips for optimal protoplast isolation for high-throughput single-cell RNA sequencing (scRNA-Seq).3.Further upstream considerations for maximizing data quality
除了分离活细胞和适应应激反应之外,细胞分离方案产生的额外因素可能对最终的scRNA-Seq数据质量产生重大影响。首先,在最终的细胞悬液中,最大限度地减少破碎细胞和部分酶解组织的碎片是很重要的。其次,减少原生质体制备过程中产生的转录影响是至关重要的,因为这可能会使下游分析复杂化。
细胞破碎会导致样本中的环境RNA,这可能会导致批次效应,阻碍真正细胞的识别。洗涤样本时以低速离心法可以有效地将细胞从碎屑中分离出来,并将细胞破碎降至最低。原生质体分离引起的转录影响应该最小化,尽可能简化细胞分离方案很重要,但对基因诱导的最大贡献可能是时间。目前文献中应用的大多数方案将酶解时间控制2小时以内。
需要考虑的另一个因素是植物细胞通常较大且形状不一。基于液滴的技术,从本质上讲,有特定的细胞大小限制。例如,10x genomics公司常用的平台的限制小于~50μm。尽管从使用该系统产生的各种数据集看起来,成功捕获了远远大于该限制的细胞,但显然存在明显的偏向较小的细胞。避免细胞大小限制的另一种可能性是从细胞核而不是整个细胞生成scRNA-Seq文库。
4.The number of cells to target
随着原生质体分离的优化,细胞计数、通过微流控装置进行处理和文库构建的方案都是相当标准的。在这里,一个关键的问题是目标细胞的数量,以及通过提取,微流控芯片上加载的细胞数量,目标细胞的数量将主要取决于目标组织的复杂性。
每个scRNA-Seq平台可以加载的细胞数量和捕获细胞的效率方面都有限制。例如,10x genomics可以承担每通道14000个细胞的负载能力,以及70%的细胞捕获率。然而,这些参数可能是基于对动物细胞的研究,植物方面的研究通常是更低的细胞捕获率,低至35%。因此,对数万个细胞的分析需要多个文库。目前,细胞捕获率是scRNA-Seq应用于植物研究的主要不确定因素之一。随着技术的进步,了解植物细胞的独特属性,如细胞大小变化较大,如何影响捕获效率,并开发适应这些影响的工具,是研究人员和这些技术开发人员的一项重要任务。
Figure 2. Considerations and tips for high-throughput single-cell RNA sequencing (scRNA-Seq) library preparation and sequencing5.Balancing sequencing reads against cell numbers
scRNA-Seq文库需要相当大的测序才能全面访问复杂的数据。在不同的研究中,UMI的深度和每个细胞检测到的基因差异很大,在任何给定的情况下,什么才是必要的或足够的是有争议的。例如,10x genomics公司建议每个细胞至少有2万个读数。每个细胞读数低于的通常适用于细胞类型分类,但可能需要较高的测序饱和度才能更深入地比较所定义的细胞群体内的异质性。在这里,每个细胞的测序深度和细胞数量之间存在内在的平衡。对于更少的细胞,更深入的测序将比使用数万或数十万个细胞带来的好处要大得多,后者通过细胞数量提供更高的分辨率。
除了前面描述的方法之外,还可以用多种方法来评估文库的质量。线粒体和叶绿体基因转录捕获水平低,突出了更少的细胞破碎,是衡量细胞悬浮质量的有力指标。像大多数研究项目中,加上bulk RNA-seq,也可以对文库质量提供指导。
6.Approaching the data
对于数据分析,首先是标准分析生成表达矩阵,然后是一些基本分析;降维、聚类、差异分析、以及整个细胞类群的时间轨迹分析。时空发育动力学、细胞亚型和状态,以及细胞对刺激和遗传扰动的反应,都将在集群内和集群之间表现出来。
拟南芥根部数据集的(UMAP)降维分析,说明来自发育中组织的细胞集群更像是发育的连续体,而不是具有共同身份的孤立细胞集群。多项研究指出了星团动力学,即分生组织细胞位于星系云的核心,向四周扩散,类似于星系。拟南芥根内胚层细胞轨迹的伪时间图,显示成熟细胞的分枝特征。拟时分析根据相对基因表达波动对细胞进行排序,通过拟时分析可以推断出发育过程细胞的分化轨迹或细胞亚型的演化过程。在建立轨迹后,可以提取差异基因表达信息,并探索和比较特定细胞谱系的表达模式。
Figure 3. Overview of routine,first single-cell RNA sequencing (scRNA-Seq) data analysis options.
7.Concluding remarks and future perspectives
已经进行的许多研究结果证明了scRNA-Seq技术为植物科学界提供的价值。然而,采用scRNA-Seq这样的新方法可能会有一定程度的犹豫并且成本也很高,但从本质上讲,如果为细胞捕获准备的细胞悬浮液是清洁和定量的,那么应该不需要担心数据的质量。
拟南芥的单细胞研究受益于丰富的基础研究和完整注释的基因组,那么在其他物种中进行scRNA-Seq分析可能需要调整单细胞制备的方案来分离可行的原生质体,并且在最后的数据分析上略作开发。当然,单细胞转录组仍然存在很多问题,比如,当前平台和分析工具如何有效地容纳不同的植物细胞?是什么决定了理想的测序深度?我们如何最好地评估数据质量?这些问题都需要我们在后续的研究中加以思考。
网友评论