美文网首页
单细胞转录组数据如何处理线粒体基因

单细胞转录组数据如何处理线粒体基因

作者: 云养江停 | 来源:发表于2022-09-29 21:47 被阅读0次

    什么是线粒体基因

    线粒体是参与细胞凋亡启动和执行的主要细胞器之一。线粒体基因在大多数细胞中表达,其表达水平是细胞类型特异性的。也就是说这个也是和细胞类型及其状态有关系的。

    为什么scrna-seq需要处理线粒体

    因为线粒体基因的高表达水平可能是:
      1. 样品质量差,导致大量细胞凋亡或裂解。
      1. 特定样本的生物学,例如肿瘤活检,可能由于代谢活动和/或坏死而增加线粒体基因表达。

    凋亡细胞表达线粒体基因,并将这些转录产物输出到哺乳动物细胞的细胞质中。例如,当凋亡的细胞被放入正常的细胞悬液中,会检测到更多的线粒体基因。检测到的线粒体膜占总膜的百分比如图所示

    image.png
    线粒体是参与细胞凋亡启动和执行的主要细胞器之一 。细胞凋亡的过程依赖于一系列信号事件,包括线粒体基因表达的增加和半胱天冬酶的激活。 因此,我们在计算每个样本中源自线粒体基因表达的UMIs数量时,评估了独特转录本的比例(percentage counts of MT-)
    在> 80%活细胞的高质量样品中,我们只检测到低比例的线粒体细胞(约3%) 与预期的一样,在只包含20%活细胞(74%)的Digitonin高样本中,线粒体转录本的数量最高 相比之下,含有50%活细胞的样本只显示线粒体基因表达略有增加(5-7%),这表明存活率确实与观察到的线粒体转录本数量相关(线粒体基因在细胞中counts数越多,表明该细胞活力越弱)。
    被裂解的细胞或细胞膜被破坏的细胞释放它们的细胞质转录本,而线粒体转录本可能仍然保留在双膜结合的线粒体内 具有完整线粒体的裂解细胞可能被gems包裹,这也增加了检测到的线粒体转录片段的概率
    如何处理

    一般我们建议卡到15%以内。

    当然还是要看这群细胞为什么会高。可以不卡阈值直接做降维分群,然后按分群来看小提琴图,如果只有一个或几个细胞群有差异的线粒体转录上调(把每个分群的差异基因拉出来看MT-基因有没有高表达)和低总UMI计数(某个cluster他的counts数很少),质量差的细胞通常有低总UMI计数,很少有上调基因(表明低总基因表达),而只有MT基因过表达。例如,在下面的图中,您可以看到基于图形的聚类t-SNE图中聚类1(顶部的青色聚类)的基因表达。与上述鉴定死亡细胞的标准一致,在这个群集中只有线粒体基因上调。对cluster 9中的细胞也进行了类似的观察。这个群最有可能代表一个死亡或频临死亡的细胞群 此时再去除也可以。
    另外一点,我们注意到,cellRanger3比cellRanger 2检测的MT(人的是MT开头的基因,其他物种主要找到相应的基因)高的细胞更多(umi拐点出现的更早)。原因主要是 cellRanger3或更高版本具有比版本2中的cell calling更敏感的算法,新算法基于EmptyDrops方法(Lun et al., 2018)。这种方法可以检测到之前版本算法所遗漏的细胞,特别是死亡或垂死的细胞,RNA含量自然较低的细胞,或异质性样本中的细胞。


    image.png

    这就也是为什么我们会主动地看看细胞中MT基因表达的原因,选择从下游分析中排除这些细胞。而在cellranger count管道中,没有直接的方法可以排除线粒体丰富的细胞 但是,您可以使用下面两种方法中的任何一种来间接完成此任务


    image.png

    下面的图显示,与其他细胞相比,Cluster1和Cluster19中的细胞的总UMI计数也很低。


    image.png

    当然我们最常用的还是Seurat。Seurat可用于筛选线粒体基因表达率高的细胞。

    相关文章

      网友评论

          本文标题:单细胞转录组数据如何处理线粒体基因

          本文链接:https://www.haomeiwen.com/subject/febtartx.html