美文网首页
生信分析之优雅的白嫖单细胞

生信分析之优雅的白嫖单细胞

作者: 科研侠 | 来源:发表于2022-02-25 12:13 被阅读0次

    01

    相信大家都有所感触,普通的生信文章很难被审稿人接受了。因此我便把目光看向了单细胞,但刚接触单细胞我就被其数据大,难理解给打败了,看着一个单细胞项目所需费用陷入的沉思。对于我这种酷爱白嫖(穷苦)人士该如何优雅的白嫖呢?

    直到最近突发奇想在PubMed上搜搜是否有使用公共数据的单细胞文章,没想到还真找到很多。

    今天就以去年7月发表在Biomed Res Int(IF=3.411)上的一篇单细胞分析文章(Single-Cell Transcriptomics-Based Study of Transcriptional Regulatory Features in the Mouse Brain Vasculature)进行分享。

    02

    数据下载

    这里我直接选择了标准化后的数据,可以看到,这是个count矩阵

    03

    加载包和数据

    ###### step1:导入数据 ###### rm(list=ls())options(stringsAsFactors = F)library(Seurat)library(ggplot2)library(clustree)library(cowplot)library(dplyr)library(stringr)library(data.table) ct=fread('GSE98816_Brain_samples_normalized_counts_matrix.txt.gz',data.table = F)ct[1:4,1:4]rownames(ct)=ct[,1]ct=ct[,-1]#创建Seurat对象sce.all=CreateSeuratObject(counts =  ct )sce.allhead(sce.all@meta.data, 10)table(sce.all@meta.data$orig.ident)

    共有19937个基因和3196个细胞 

    将细胞按样品分类

    phe=str_split( rownames(sce.all@meta.data),'_', simplify = T)head(phe) table(phe[,1])sce.all@meta.data$orig.ident= phe[,1]table(sce.all@meta.data$orig.ident)

    质控

    过滤指标1:最少表达基因数的细胞&最少表达细胞数的基因

    selected_c<-WhichCells(sce.all,expression=nFeature_RNA>300)selected_f<-rownames(sce.all)[Matrix::rowSums(sce.all@assays$RNA@counts>0) > 3]sce.all.filt<-subset(sce.all,features=selected_f,cells=selected_c)dim(sce.all)dim(sce.all.filt)

    只过滤了基因

    过滤指标2:线粒体/核糖体基因比例(根据上面的violin图)

    selected_mito <- WhichCells(sce.all.filt, expression = percent_mito <15)selected_ribo <- WhichCells(sce.all.filt, expression = percent_ribo >0.3)selected_hb <- WhichCells(sce.all.filt, expression = percent_hb <1)length(selected_hb)length(selected_ribo)length(selected_mito)sce.all.filt <- subset(sce.all.filt, cells = selected_mito)sce.all.filt <- subset(sce.all.filt, cells = selected_ribo)sce.all.filt <- subset(sce.all.filt, cells = selected_hb)dim(sce.all.filt)table(sce.all.filt$orig.ident) 

    可以看到这里过滤了625个细胞,主要过滤了线粒体基因和核糖体基因

    过滤指标3:过滤特定基因

    #FilterMALAT1管家基因sce.all.filt<-sce.all.filt[!grepl("MALAT1", rownames(sce.all.filt),ignore.case = T), ]#FilterMitocondrial线粒体基因sce.all.filt<-sce.all.filt[!grepl("^Mt", rownames(sce.all.filt),ignore.case = T), ]dim(sce.all.filt)

    指标3没有过滤细胞

    至此,质控就结束了

    文章中未过滤掉细胞,可能是未发现线粒体基因。

    04

    另外在进行下一步SingleR注释时,我发现我的结果和文章中并不一样。

    文章中主要是内皮细胞、成纤维细胞、少突胶质细胞和小胶质细胞,而我使用自动注释的结果主要是星形胶质细胞,加上我的生物信息学背景不足,因此这里就不做分享了。

    虽然无法完全复现,但事实证明,我们是可以优雅的白嫖单细胞文章的,好学的白嫖爱好者们快学起来吧!

    -END-

    文 | 万有引力

    相关文章

      网友评论

          本文标题:生信分析之优雅的白嫖单细胞

          本文链接:https://www.haomeiwen.com/subject/toyxrrtx.html