拟时间分析(pseudotime)也就是 细胞轨迹分析(cell trajectory)的定义就是通过关键基因的表达,对细胞进行排序进而模拟出随着时间的进行,细胞的发育状态的改变。
那么问题来了~~
一.是如何选取基因集?
二.是如何排序?
三是如何找到状态改变点?是否有分支?
这些是拟时间分析类软件必须要解决的问题。Monocle2 是众多拟时间分析软件中比较流行的一款。它对于这三个问题的回答,简述如下:
第一个问题:如何选取基因集?

如果仅仅依赖于文献和教科书的“明星基因”,很有可能受到已有经验的限制。因此monocle采用dpFeatuer方法。就是是简单的找到tsne分群之后的差异基因。
diff_test_res <- differentialGeneTest(HSMM_myo[expressed_genes,], fullModelFormulaStr = "~Media")ordering_genes <- row.names (subset(diff_test_res, qval < 0.01))
第二个问题:
如何排序?选取分支?Monocle 2通过反向图嵌入方法,如下:


简单来说:
先降维,抓取主要特征,降低计算量,其次构建生成树,不断迭代直至收敛。选定一个节点作为根,每个细胞的伪时间计算为其沿树到根的最短距离,并根据主图自动分配其分支。

网友评论