我一直强调过,所谓的单细胞数据分析,其实就5个R包,分别是: scater,monocle,Seurat,scran,M3Drop 需要熟练掌握它们的对象,:一些单细胞转录组R包的对象 分析流程过一遍
- step1: 创建对象
- step2: 质量控制
- step3: 表达量的标准化和归一化
- step4: 去除干扰因素(多个样本整合)
- step5: 判断重要的基因
- step6: 多种降维算法
- step7: 可视化降维结果
- step8: 多种聚类算法
- step9: 聚类后找每个细胞亚群的标志基因
- step10: 继续分类
但是没有强调结果如何取舍和解释,很多朋友会有误解,以为通过流程化分析,细胞聚在一起,就是一个细胞类,一个纯粹的细胞类群,其实不然,比如下面这个。
来自于发表在Science. 2016 Apr,题目是: Dissecting the multicellular ecosystem of metastatic melanoma by single-cell RNA-seq. 文献,找到单细胞转录组表达矩阵GSE72056, 研究者选择了19个黑色素瘤病人,获得了4645个单细胞,进行转录组测序。文件是 GSE72056_melanoma_single_cell_revised_v2.txt.gz,载入R里面走scater流程即可。
到底如何对细胞亚群进行命名
可以查看我们单细胞天地早期教程:单细胞转录组聚类后的细胞类群如何查找数据库来定义
实际上是需要根据生物学背景,marker基因来,可以看到第一群细胞,其实是T细胞和NK细胞的合体。
而且T细胞本身还可以继续细分。
因为细胞分群,很大程度上取决于算法,比如这个是:
DBscan clusters derived from tSNE coordinates, with parameters eps=6 and min-points=10. Eleven clusters are indicated by numbers and colors.
只有生物学背景知识基因的差异吗
因为定义好了不同细胞亚群,就可以把它们独立找到各自的更多的特异性表达基因,热图可视化如下:
可以很清楚的看到,T细胞和B细胞,特异性表达的基因一大把,而且它们各自还可以继续细分!
细胞可以无限分类吗
这个问题其实无解,理论上是不可能两个细胞完全一模一样的,总是会有些微差别!
比如我看到一个 《国际免疫学杂志》 1988年04期 文献提到了:自然杀伤活性——一种功能而不是细胞类型的定义
许多实验室研究了非免疫的“正常”宿主淋巴细胞的细胞毒功能。这种功能的特征是一种正常淋巴细胞对NK敏感的靶细胞的非MHC限制性的溶解作用,凡在短期(3—6小时)实验中表现这种溶解作用的细胞传统上都称为“NK”细胞。然而,这种根据功能活性所作的不精确的定义现已导致不少混乱,主要原因是发现表型甚至属性极不相同的细胞均能显示NK活性,因而这些细胞都被称为NK细胞。
网友评论