今天我们完成的是热图展示不同细胞类型差异基因数目。这个图很多文章都在用,做这个图流程还是挺复杂的。主要在两个方面。第一个是:分开整理上下调基因数据到需要的格式。第二个是:标注specific基因数目的位置坐标。所以干脆包成一个通用的函数。同时我们也进行了创新。第一:我认为只显示差异基因数目总感觉少了点啥,所以我们添加了参数,可以标注自己关注的基因。第二:图形保存提供了两种方式,可供选择。那么学习这个函数不仅仅是做了这么一个图,您可以拆解函数,学习数据的处理以及该机热图绘制!****这个函数的写作还是花费了较多的时间和精力的!
![](https://img.haomeiwen.com/i26169980/72bbde221b081640.png)
【****1****:A Single-Cell Transcriptomic Atlas of Human Skin Aging】
【****2****:Microbiota-host crosstalk in the newborn and adult rumen at single-cell resolution】
【****3****:A single-cell landscape of triptolide-associated testicular toxicity in mice】
这个图的特点是将不同类型的celltype差异基因分上下调展示,而且每个celltype特异性的上下调基因和shared基因分开展示并展示数目。我们的函数将差异分析和可视化进行了整合,可以轻松的完成这个图,不用因为数据的整理和图形的修改而烦恼。
接下来我们具体看看函数的操作效果,首先看看函数的参数:
![](https://img.haomeiwen.com/i26169980/0d14e27e4aba779f.png)
接下来我们利用单细胞数据演示一下:我们需要先做差异基因分析,所以DEGs选择F,代表尚未进行差异基因分析,其他的参数是差异基因分析Findmarker的参数。
setwd('D:/KS项目/单细胞差异基因数目热图') #设置工作路径
load("D:/KS项目/单细胞差异基因数目热图/sce.RData")#加载单细胞数据
head(sce@meta.data)#看一下分组
DefaultAssay(sce) <- 'RNA'
table(sce$orig.ident)
table(sce$celltype)
#作图,直接组合出图
KS_DEGs_number(seurat_obj = sce,
DEGs=F,
idents = "celltype",
group.by = "orig.ident",
ident.1 = "AEH",
ident.2 = "HC",
min.pct = 0.5,
logFC = 0.8,
width = 3,
height = 6,
heatmap_show =F,
col = list(sample=c('SMC'='#006699','LY'='#993333','UEC'='#33CCCC',
"SF" ="orange","CEC" = "red","EC" = "grey","MAC"="blue")))
![](https://img.haomeiwen.com/i26169980/de8125583b28e58f.png)
![](https://img.haomeiwen.com/i26169980/4321bd76eecaecf2.png)
上面作图heatmap_show参数使用的是默认的F,所以直接组合出图,我们可以选择T,直接分别导出上下调的热图。这里因为已经有了差异基因的结果,所以为了避免不必要的运行,DEGs参数选择T。
#pdf分别保存Heatmap,因为上面已经进行了差异分析
#再次作图为了防止重复,DEGs参数选择T。heatmap_show选择T
KS_DEGs_number(seurat_obj = sce,
DEGs=T,
idents = "celltype",
group.by = "orig.ident",
ident.1 = "AEH",
ident.2 = "HC",
min.pct = 0.5,
logFC = 0.8,
width = 3,
height = 6,
heatmap_show = T,
col = list(sample=c('SMC'='#006699','LY'='#993333','UEC'='#33CCCC',
"SF" ="orange","CEC" = "red","EC" = "grey","MAC"="blue")))
#运行完成后,路径文件夹中会出现先两个pdf文件,分别是g1、g2,是上下调的图
![](https://img.haomeiwen.com/i26169980/a1ac544aa755c0ba.png)
最后,我们还可以标注感兴趣的基因。
#标记感兴趣的基因
label_gene <- read.csv("label_genes.csv", header = T)#可以整理为一个frame
#也可以直接在参数gene_list_up中以向量的形式输入
KS_DEGs_number(seurat_obj = sce,
DEGs=T,
idents = "celltype",
group.by = "orig.ident",
ident.1 = "AEH",
ident.2 = "HC",
min.pct = 0.5,
logFC = 0.8,
width = 3,
height = 6,
heatmap_show = T,
col = list(sample=c('SMC'='#006699','LY'='#993333','UEC'='#33CCCC',
"SF" ="orange","CEC" = "red","EC" = "grey","MAC"="blue")),
gene_label = T,
gene_list_up = label_gene$up,
gene_list_down = label_gene$down)
![](https://img.haomeiwen.com/i26169980/d907c5561948b388.png)
这样这个图就很完美了。这里有两个注意事项,也是我们在其他数据集测试的时候发现的问题,第一个,如果某个celltype,在一组中只有0-2个细胞,那么差异基因分析会出错,况且这样的数据也不适合做差异分析,可以将这个celltype删除再进行分析作图。第二种情况则是某些细胞类型差异基因为0,这时候我们设置了终止函数,因为这样的数据展示没有意义,况且也会报错,所以可以将这种celltype删除。
网友评论