美文网首页单细胞转录组
单细胞多组差异基因展示及基因标注函数

单细胞多组差异基因展示及基因标注函数

作者: KS科研分享与服务 | 来源:发表于2023-10-17 13:58 被阅读0次

参考链接:
https://www.bilibili.com/video/BV1ch4y1P7yS/?spm_id_from=333.999.0.0&vd_source=05b5479545ba945a8f5d7b2e7160ea34

今天我们完成的是热图展示不同细胞类型差异基因数目。这个图很多文章都在用,做这个图流程还是挺复杂的。主要在两个方面。第一个是:分开整理上下调基因数据到需要的格式。第二个是:标注specific基因数目的位置坐标。所以干脆包成一个通用的函数。同时我们也进行了创新。第一:我认为只显示差异基因数目总感觉少了点啥,所以我们添加了参数,可以标注自己关注的基因。第二:图形保存提供了两种方式,可供选择。那么学习这个函数不仅仅是做了这么一个图,您可以拆解函数,学习数据的处理以及该机热图绘制!****这个函数的写作还是花费了较多的时间和精力的!


【****1****:A Single-Cell Transcriptomic Atlas of Human Skin Aging】
【****2****:Microbiota-host crosstalk in the newborn and adult rumen at single-cell resolution】
【****3****:A single-cell landscape of triptolide-associated testicular toxicity in mice】

这个图的特点是将不同类型的celltype差异基因分上下调展示,而且每个celltype特异性的上下调基因和shared基因分开展示并展示数目。我们的函数将差异分析和可视化进行了整合,可以轻松的完成这个图,不用因为数据的整理和图形的修改而烦恼。

接下来我们具体看看函数的操作效果,首先看看函数的参数:



接下来我们利用单细胞数据演示一下:我们需要先做差异基因分析,所以DEGs选择F,代表尚未进行差异基因分析,其他的参数是差异基因分析Findmarker的参数。

setwd('D:/KS项目/单细胞差异基因数目热图')  #设置工作路径
load("D:/KS项目/单细胞差异基因数目热图/sce.RData")#加载单细胞数据
head(sce@meta.data)#看一下分组
DefaultAssay(sce) <- 'RNA'
table(sce$orig.ident)
table(sce$celltype)

#作图,直接组合出图
KS_DEGs_number(seurat_obj = sce,
               DEGs=F,
               idents = "celltype",
               group.by = "orig.ident",
               ident.1 = "AEH",
               ident.2 = "HC",
               min.pct = 0.5,
               logFC = 0.8,
               width = 3,
               height = 6,
               heatmap_show =F,
               col = list(sample=c('SMC'='#006699','LY'='#993333','UEC'='#33CCCC',
                                  "SF" ="orange","CEC" = "red","EC" = "grey","MAC"="blue")))

运行完成后,路径文件会出现四个文件,两个rds文件,分别是不同celltype上下调差异基因list,两个csv文件,分别是上下调差异基因列表文件。

上面作图heatmap_show参数使用的是默认的F,所以直接组合出图,我们可以选择T,直接分别导出上下调的热图。这里因为已经有了差异基因的结果,所以为了避免不必要的运行,DEGs参数选择T。

#pdf分别保存Heatmap,因为上面已经进行了差异分析
#再次作图为了防止重复,DEGs参数选择T。heatmap_show选择T
KS_DEGs_number(seurat_obj = sce,
               DEGs=T,
               idents = "celltype",
               group.by = "orig.ident",
               ident.1 = "AEH",
               ident.2 = "HC",
               min.pct = 0.5,
               logFC = 0.8,
               width = 3,
               height = 6,
               heatmap_show = T,
               col = list(sample=c('SMC'='#006699','LY'='#993333','UEC'='#33CCCC',
                                   "SF" ="orange","CEC" = "red","EC" = "grey","MAC"="blue"))) 

#运行完成后,路径文件夹中会出现先两个pdf文件,分别是g1、g2,是上下调的图

最后,我们还可以标注感兴趣的基因。

#标记感兴趣的基因
label_gene <- read.csv("label_genes.csv", header = T)#可以整理为一个frame
#也可以直接在参数gene_list_up中以向量的形式输入
KS_DEGs_number(seurat_obj = sce,
               DEGs=T,
               idents = "celltype",
               group.by = "orig.ident",
               ident.1 = "AEH",
               ident.2 = "HC",
               min.pct = 0.5,
               logFC = 0.8,
               width = 3,
               height = 6,
               heatmap_show = T,
               col = list(sample=c('SMC'='#006699','LY'='#993333','UEC'='#33CCCC',
                                   "SF" ="orange","CEC" = "red","EC" = "grey","MAC"="blue")),
               gene_label = T,
               gene_list_up = label_gene$up, 
               gene_list_down = label_gene$down)

这样这个图就很完美了。这里有两个注意事项,也是我们在其他数据集测试的时候发现的问题,第一个,如果某个celltype,在一组中只有0-2个细胞,那么差异基因分析会出错,况且这样的数据也不适合做差异分析,可以将这个celltype删除再进行分析作图。第二种情况则是某些细胞类型差异基因为0,这时候我们设置了终止函数,因为这样的数据展示没有意义,况且也会报错,所以可以将这种celltype删除。

相关文章

网友评论

    本文标题:单细胞多组差异基因展示及基因标注函数

    本文链接:https://www.haomeiwen.com/subject/mvtqidtx.html