单细胞分析的主要问题存在较明显的批次效应,影响聚类效果,深度学习方法,逐渐可以应用到单细胞分析领域。
单细胞RNA测序(scRNA-seq)可以通过无监督的聚类来表征细胞类型和状态,但是不断增加的细胞数量和批次效应给计算带来了挑战。我们提出了DESC,这是一种无监督的深度嵌入算法,通过迭代优化聚类目标函数来对scRNA-seq数据进行聚类。通过迭代的自我学习,DESC会逐渐消除批次效应,只要批次之间的技术差异小于真实的生物学差异即可。作为一种软聚类算法,DESC的聚类分配概率在生物学上可以解释,并且可以揭示细胞的离散和伪时态结构。全面的评估表明,DESC可以在群集精度和稳定性之间取得适当的平衡,并且占用的内存很小,不需要显式要求批处理信息即可去除批处理效果,并且可以在可用时利用GPU。随着单细胞研究规模的不断扩大,我们相信DESC将为生物医学研究人员提供一个有价值的工具,以消除复杂的细胞异质性。
文献来源:https://www.nature.com/articles/s41467-020-15851-3
网友评论