文章简介
image.png背景简介
- soupX可以是单细胞转录组数据分析中 质控中的步骤。
- 基于液滴法的单细胞转录组测序,液滴有以下其中情况,
- 理想情况的 是单个细胞内转录组表达情况1,大多数情况没有这么理想,
- 比如图二,测序的数据会包含游离mRNA污染,soupX针对这种情况对游离mRNA进行过滤
- 基于液滴法的单细胞转录组测序,液滴有以下其中情况,
- 游离RNA来源于裂解细胞mRNA,存在于在单细胞悬液,给测序数据造成污染。soupX利用空液滴中游离RNA和聚类信息 来对表达量 进行矫正 达到去噪效果
原理介绍
- soupX去噪一共分为3步,第一步:定义污染的表达文件,计算所有空液滴中,某基因counts占所有污染基因counts的比率(bg)
- 计算方法:每个基因在所有空液滴的counts /所有空液滴中所有基因counts总和 ,如果一个液滴的 nUMI<10 则定义为空液滴
- 通俗例子:很多箱子中有三种不同颜色的球:红白蓝,每种颜色球有不同数目,计算红球占比 红球个数/该箱子中所有球个数红球bg 红球代表某基因,箱子代表所有空液滴 每个基因 污染程度不同
-
第二步:估计全局污染率反映:在细胞c中 游离mRNA的UMIs数 占总UMIs数 的比率
- 两个前提:
- 一个液滴捕获的数据是 细胞内源mRNA UMI总和 + 游离mRNA的UMI 总和。
- 游离RNA在细胞悬液中均匀分布的该次实验中,每个细胞的污染率是相同的
-
实际测到细胞c中基因g counts来源有两个 细胞内+背景污染的,现在ngc已知,计算出ogc,就可以得到我们想要的mgc
image.png
- 两个前提:
-
第三步:对基因表达数据进行矫正,基于此 再将每个cluster的基因counts 分配给各个细胞
image.png
文献中应用
- image.png
- image.png
网友评论