美文网首页
soupX原理介绍

soupX原理介绍

作者: Bio小盼 | 来源:发表于2023-10-09 15:54 被阅读0次

文章简介

image.png

背景简介

  • soupX可以是单细胞转录组数据分析中 质控中的步骤。
    • 基于液滴法的单细胞转录组测序,液滴有以下其中情况,
      • 理想情况的 是单个细胞内转录组表达情况1,大多数情况没有这么理想,
      • 比如图二,测序的数据会包含游离mRNA污染,soupX针对这种情况对游离mRNA进行过滤
  • 游离RNA来源于裂解细胞mRNA,存在于在单细胞悬液,给测序数据造成污染。soupX利用空液滴中游离RNA和聚类信息 来对表达量 进行矫正 达到去噪效果
image.png

原理介绍

  • soupX去噪一共分为3步,第一步:定义污染的表达文件,计算所有空液滴中,某基因counts占所有污染基因counts的比率(bg)
    • 计算方法:每个基因在所有空液滴的counts /所有空液滴中所有基因counts总和 ,如果一个液滴的 nUMI<10 则定义为空液滴
    • 通俗例子:很多箱子中有三种不同颜色的球:红白蓝,每种颜色球有不同数目,计算红球占比 红球个数/该箱子中所有球个数红球bg  红球代表某基因,箱子代表所有空液滴 每个基因 污染程度不同
image.png
  • 第二步:估计全局污染率反映:在细胞c中 游离mRNA的UMIs数 占总UMIs数 的比率

    • 两个前提:
        1. 一个液滴捕获的数据是 细胞内源mRNA UMI总和 + 游离mRNA的UMI 总和。
        1. 游离RNA在细胞悬液中均匀分布的该次实验中,每个细胞的污染率是相同的
    • 实际测到细胞c中基因g counts来源有两个 细胞内+背景污染的,现在ngc已知,计算出ogc,就可以得到我们想要的mgc


      image.png
  • 第三步:对基因表达数据进行矫正,基于此 再将每个cluster的基因counts 分配给各个细胞


    image.png

文献中应用

  • image.png
  • image.png

小结

image.png

相关文章

网友评论

      本文标题:soupX原理介绍

      本文链接:https://www.haomeiwen.com/subject/vkvibdtx.html