实用干货 | 利用细胞类型注释工具SingleR进行细胞类型注释

作者: 百奥益康 | 来源:发表于2022-04-12 16:47 被阅读0次

实用干货 | 利用细胞类型注释工具SingleR进行细胞类型注释
单细胞转录组细胞类型注释分析合集
【单细胞】SingleR注释细胞类型
SingleR单细胞类型自动注释与celldex参考数据包
单细胞聚类及鉴定细胞类型-SingleR
SingleR如何使用自定义的参考集
singleR注释细胞类型问题集锦
NBIS系列单细胞转录组数据分析实战（六）：细胞类型注释
单细胞分析实录(14): 细胞类型注释的另一种思路 — Cell
使用SingleR包进行单细胞类型注释分析

在之前的文章中为大家介绍了Seurat这款单细胞分析软件（可在本文末尾点击查看），今天为大家介绍如何对分群后的细胞进行细胞类型注释。细胞类型注释作为单细胞研究中最重要的一个环节，大致分为人工注释和软件注释。

人工注释

人工注释需要借助文献检索marker或者结合常用的注释数据库，例如两个常用的数据库：

CellMarker（http://bio-bigdata.hrbmu.edu.cn/CellMarker/）；

panglaoDB（A Single Cell Sequencing Resource ForGene Expression Data，https://panglaodb.se/）。

人工注释比较适合有经验的科研工作者，但随着单细胞的研究越来越多，可提供给我们的细胞类型的marker信息也越来越丰富，人工注释比较耗费精力，优点在于准确性相对较好。

软件注释

软件自动化注释一般是使用软件内置数据集进行注释，操作相对简单。但是准确性会相对较差，不过可以作为一种很好的辅助注释手段。目前用于单细胞类型鉴定的工具有很多，其中singleR是各方面综合来看较为优秀的软件。

SingleR简介

关于SingleR软件的报道，最早来自一篇肺部巨噬细胞研究的单细胞论文，这篇文章作者用多份实测数据证明了SingleR软件可以较好基于单细胞转录组数据对各个细胞进行鉴定。该算法基础的工作原理很简单：准备一套参考数据集，参考数据中每个样品被人工注释为一种主要的细胞类型，及相应的细胞亚型标签；然后通过差异表达的方法或方差分析的方法获取到已知细胞类型的variable genes，在variable genes 中计算每一个单细胞与参考数据集中每一个样品的spearman相关系数，同一细胞类型下多个参考样品的相关系数的80%分位数作为这个单细胞注释到此细胞类型的得分；保留与参考细胞类型注释最大得分差值在0.05以内的参考细胞类型及，重新计算 variable genes，再次计算测试细胞与剩下参考细胞类型集的相关系数，迭代，直到只剩下两种细胞类型时，保留相关性得分最高的已知细胞类型，为此细胞注释到的细胞类型。

目前SingleR内置的数据库有7个，其中包括5个人类的数据库：HumanPrimaryCellAtlasData、BlueprintEncodeData、DatabaseImmuneCellExpressionData、MonacoImmuneData、NovershternHematopoieticData，2个小鼠的数据库ImmGenData、MouseRNAseqData，可应用于相应物种及组织的单细胞结果注释。