美文网首页
生信分析

生信分析

作者: 概普生信 | 来源:发表于2021-01-04 09:27 被阅读0次

    Hello,大家好呀!我今天想和大家分享一篇蛮有意思的文献,于2020年11月13日发表于Scientific Reports ,题目为“Characterisation of CD4+ T-cell subtypes using single cell RNA sequencing and the impact of cell number and sequencing depth”,文章探讨了测序深度和细胞数量对准确鉴定CD4 + T细胞亚型的影响,以及静息或刺激条件下对细胞分型的影响。更多生信人原创文章见:生信人

    更多生信分析 

    http://gaptechsxr.mikecrm.com/1vdMmqy

    背景介绍

    1、CD4+T细胞的分型多种多样,scRNA-seq(如Drop-Seq或10xGenomics)可以用于研究细胞间的异质性,探索细胞分化及与健康或疾病相关的细胞亚型;

    2、设计scRNA-seq实验的两个关键考虑因素是读取深度和细胞数量。尽管已经证明,对于Fluidigm微流控平台,每个细胞50,000个reads足以对细胞进行分型,但每个细胞需要500,000至一百万个reads才能检测更广泛的基因表达并量化细微的表达变化;

    3、当前基于液滴系统的建议范围是每个细胞20,000-50,000个reads,部分原因是这些方法依赖于3'mRNA-seq分析,而不是其他基于非液滴的技术通常采用的全长分析。尽管有此建议,仍需要根据细胞类型和实验要求调整该深度;

    4、考虑细胞数量时,没有公认的建议,因为这取决于实验要求和样品异质性。样本越异质,就需要越多的细胞来捕获技术噪声下的真实变异性。例如,在对约2700个外周血单核细胞(PMBC)的数据集进行的分析中,可以轻松识别出8个主要细胞群,包括CD4 + T细胞,CD8 + T细胞,B细胞和单核细胞。但是,通过将细胞数增加到约68,000个,可以将CD4 + T细胞进一步分解为代表幼稚,记忆和调节性CD4 + T细胞。

    方法及分析流程

    1. Sample:通过对PBMC进行流式分析,对CD4+细胞进行提取,并且按照1:1进行刺激;

    2. Single cell RNA-seq:Chromium Single Cell 3′ Library & Gel Bead v2 kit,Seurat

    3.   参比:GRCh38.p10;

    4. QC:removed cells expressing less than 200 genes and genes that were expressed in less than  3 cells;

    5. 提取Reads不同深度子集:为了研究不同测序深度对细胞分群的影响,对不同测序深度子集进行提取;

    6. 细胞数量不同子集:通过随机采样,提取不同的细胞数量进行后续分析;

    7. 评估细胞分群准确性:随机森林分类器。

    结果分析

    研究人员回收了5586个未受刺激的细胞和4621个受刺激的细胞,每个细胞的平均reads数为260,849和333,333。两种样品的测序饱和率均达到96.5%。然而,尽管这导致检测到的基因总数相似,但在不同的reads深度中,受刺激的样品中每个细胞的中位基因多出30%(1443 vs 1090),这可能是由于刺激后的转录激活所致。此外,与受刺激的样本相比,未受刺激的样本中所包含的劣质细胞或者多重细胞会更多(8.8%比4.8%)。图一为在不同条件下的细胞分群。

    表一  不同条件下的数据QC

    图一:不同条件下的细胞样本进行分群

    结果一:细胞质量与Reads深度无关;

    对不同细胞reads深度的分析表明,测序饱和度在开始达到平稳状态后迅速上升到大约90%(图2a)。这相当于每个细胞的reads深度约为70000-90000。受激样品显示出更高的基因总数,表明受激样品具有更高的转录活性(图2b– d)。QC之前和之后的QC细胞数量在所有reads深度上都保持稳定(图2e,f),这表明即使在进行质量控制后,识别劣质细胞的能力或检测到基因的数量也与reads深度无关。

    图二:不同条件下的测序参数

    结果二:未受刺激的细胞分群更容易受测序深度的影响;

    通过对不同测序深度的数据集进行分群聚类发现,受刺激的样品可以进行更好的细胞分群,此外,受刺激的样品聚类分群的结果更为一致,甚至在每个细胞50000 reads的情况下。

    图三:不同测序深度下的细胞分群

    在评估细胞的准确性上,发现在不同的测序深度下,未受刺激的样本细胞分型准确性较低。未受刺激条件下,每个细胞65,000个reads下的准确度为82.6%,而受刺激情况下的准确度为91.3%(Fig. 4a,b)。

    图四:不同条件数据集下细胞分群的准确性

    图五:不同测序深度下细胞分群的准确性

    结果四:细胞数量比测序深度更重要

    与测序深度的影响相对较小相比,细胞数对未刺激和刺激的样品都有更深远的影响(图4c,d)。对于未刺激且深度高的样品,2500个细胞的分群准确度迅速降至80%以下,500个细胞的准确度降至60%以下。生信人同样,由于受刺激样品的细胞数较少,准确性也受到影响,3500个细胞减少到90%以下,1000个细胞减少到70%以下,500个细胞减少到60%以下。此外,与测序深度相比,细胞采样的复制变异性也更高,并且通常在较低的细胞数时这种变异性会增加。

    图六:准确度的中位数与测序深度和细胞数的关系

    结果五:细胞类型在受激细胞中更为明显

    从图1中可以看出,细胞的测序深度对细胞分群的影响并不大,并且再受刺激的细胞中的细胞分型更为明显,基因差异表达更为突出。

    总结

    (1) 在未受刺激的细胞中可以进行准确的细胞分析,测序深度为每个细胞60000-70000 reads;

    (2) 受刺激的细胞的细胞分类准确性更高;

    (3) 细胞数量对于细胞分群具有深远的影响,至少需要大约2500个细胞才能进行准确分类。

    参考文献

    Ding, J., Smith, S.L., Orozco, G. et al. Characterisation of CD4+ T-cell subtypes using single cell RNA sequencing and the impact of cell number and sequencing depth. Sci Rep 10, 19825 (2020).

    更多生信数据分析 关注 填写http://gaptechsxr.mikecrm.com/1vdMmqy

    一种疾病,一个分析方向,仅限一人

    相关文章

      网友评论

          本文标题:生信分析

          本文链接:https://www.haomeiwen.com/subject/icmmoktx.html