用已有的数据库对单细胞测序数据细胞类型的鉴定至关重要。而利用参考数据集来鉴定新的细胞类型的方法具有两个方面的需求:(1)如果query细胞的细胞类型存在于reference中,那么需要匹配正确的细胞类型(2)如果query细胞的细胞类型在reference中缺失,也需要正确的以 “unassigned”的标识识别出来。但是现有的方法往往不能同时兼顾且无法适用于多个来源的数据集。
基于以上考量,作者提出了一种基于人工智能度量学习的细胞类型鉴定框架scLearn。scLearn的主要贡献如下:(i)scLearn具有很好的鉴定细胞类型性能(ii)scLearn可有效识别参考数据集中不存在的新型细胞类型(iii)scLearn中提出了一种多标签单细胞分配策略,可将单个细胞同时分配给适当的时间状态和细胞类型,对细胞发育和谱系分析十分有效。
文献原文:https://advances.sciencemag.org/content/6/44/eabd0855
scLearn: https://github.com/bm2-lab/scLearn
网友评论