单细胞RNA-seq测序技术对数百万个单细胞进行定位的能力彻底改变了细胞核发育生物学领域,提供了极好的视角去理解在多物种中细胞类型及功能的多样性,这些技术有希望发展成为详细描述细胞类型系统,可以描述不同物种细胞类型之间的进化和发展关系。这将需要利用单细胞转录组对许多物种及类群进行采样,并且才用的方法对细胞类型的同源性及多样性进行分类,尽管目前许多用于分析单细胞数据及识别细胞类型的工具,但对于跨物种比较犹豫喜多生物学及技术因素而变得复杂。这些因素包括在测序深度的批次效应,直系同源和旁系同源基因之间的进化关系,以及很少被理解的进化力量形成的物种转录组变异,这篇综述就是讨论了当前跨物种比较单细胞组学数据的计算方法的最新进展。这些方法很有可能提供宝贵的简介,了解进化的力量如何在细胞水平上发挥作用,并将进一步加深我们对动物起源及细胞多样性的理解。
单细胞测序及单细胞聚类方法
现在已开发出来多种方法,开一用来分离标记单细胞,微流控和微孔技术已经提供了增加细胞通量达到百万级别细胞,这些技术浆细胞封装在微流体液滴中,或将细胞单独放在微孔中,这极大地提高了我们观察细胞异质性及稀有细胞的能力,sci-RNA 技术进一步增加了分离过程中联合标签细胞分析增加细胞数量,这些技术以牺牲测序深度为代价增加了细胞宽度,被认为与较少细胞的高深度测序相比可以更可靠的鉴定细胞异质性。
随着这些单细胞实验出现在分析这些数据集的高维性时,需要复杂的方法来应对统计学上的挑战。这两简单的描述单细胞分析数据流程seurat工具箱,其他可供选咋的方法在其他地方可以查阅。许多类似的包可以产生类似的数据文件格式,主要包括细胞聚类和注释,然后可以适用下面介绍的技术来进行跨物种比较。首先进行数据降维,利用高可变基因(对细胞简变异有较强贡献的基因),利用PCA的方法将数据投影到地位空间。最新的聚类算法采用基于图的方法,在基于模块化及K邻近图中的细胞密度PCA定义聚类,将基因表达的空间相互接近的细胞分组。 tsne及UMAP方法可用于细胞群的可视化,将更高维度的可变性降维2维或者三维。
处理实验及生物学批次效应
通过对单细胞数据比较,可以观察到生物学咸咸的可重复性
网友评论