美文网首页
soupX原理介绍

soupX原理介绍

作者: Bio小盼 | 来源:发表于2023-10-09 15:54 被阅读0次

    文章简介

    image.png

    背景简介

    • soupX可以是单细胞转录组数据分析中 质控中的步骤。
      • 基于液滴法的单细胞转录组测序,液滴有以下其中情况,
        • 理想情况的 是单个细胞内转录组表达情况1,大多数情况没有这么理想,
        • 比如图二,测序的数据会包含游离mRNA污染,soupX针对这种情况对游离mRNA进行过滤
    • 游离RNA来源于裂解细胞mRNA,存在于在单细胞悬液,给测序数据造成污染。soupX利用空液滴中游离RNA和聚类信息 来对表达量 进行矫正 达到去噪效果
    image.png

    原理介绍

    • soupX去噪一共分为3步,第一步:定义污染的表达文件,计算所有空液滴中,某基因counts占所有污染基因counts的比率(bg)
      • 计算方法:每个基因在所有空液滴的counts /所有空液滴中所有基因counts总和 ,如果一个液滴的 nUMI<10 则定义为空液滴
      • 通俗例子:很多箱子中有三种不同颜色的球:红白蓝,每种颜色球有不同数目,计算红球占比 红球个数/该箱子中所有球个数红球bg  红球代表某基因,箱子代表所有空液滴 每个基因 污染程度不同
    image.png
    • 第二步:估计全局污染率反映:在细胞c中 游离mRNA的UMIs数 占总UMIs数 的比率

      • 两个前提:
          1. 一个液滴捕获的数据是 细胞内源mRNA UMI总和 + 游离mRNA的UMI 总和。
          1. 游离RNA在细胞悬液中均匀分布的该次实验中,每个细胞的污染率是相同的
      • 实际测到细胞c中基因g counts来源有两个 细胞内+背景污染的,现在ngc已知,计算出ogc,就可以得到我们想要的mgc


        image.png
    • 第三步:对基因表达数据进行矫正,基于此 再将每个cluster的基因counts 分配给各个细胞


      image.png

    文献中应用

    • image.png
    • image.png

    小结

    image.png

    相关文章

      网友评论

          本文标题:soupX原理介绍

          本文链接:https://www.haomeiwen.com/subject/vkvibdtx.html