美文网首页
runGenie3-临时0717

runGenie3-临时0717

作者: oceanandshore | 来源:发表于2023-07-16 19:40 被阅读0次
############################### runGenie3 ################################


integrated = readRDS( file = "./integrated_0708.rds")


# 增加一列seurat_clusters,下一步改成celltype
integrated@meta.data$seurat_clusters_1 =  integrated@meta.data$seurat_clusters  

# 把metadata里面的seurat_clusters_1改成celltype
current.cluster.ids <- c(0:20)
new.cluster.ids <- c("Naive CD8+ ", 
                     "CD4 TCM", 
                     "CD8 TCM", 
                     "Naive CD4+", 
                     "NK", 
                     "CD8 TEM", 
                     "CD4 TEM", 
                     "Naive B cells", 
                     "CD4 CTL ", 
                     "Tregs", 
                     "Other T ", 
                     "γδ T ", 
                     "Unknown", 
                     "CD16 Mono", 
                     "Memory B ",
                     "MAIT", 
                     "CD14 Mono ", 
                     "Platelet ", 
                     "Dc", 
                     "Eryth", 
                     "Double-negative T ") 

integrated@meta.data$celltype = plyr::mapvalues(x = integrated@meta.data[,"seurat_clusters_1"], from = current.cluster.ids, to = new.cluster.ids)

dim(integrated)
#21249 18578





### Seurat 对象读取
exprMat = as.matrix(integrated@assays$RNA@counts) #取出表达矩阵

#准备细胞meta信息
cellInfo = as.data.frame(integrated@meta.data)  #取出注释信息
colnames(cellInfo)[which(colnames(cellInfo)=="orig.ident")] <- "sample"
colnames(cellInfo)[which(colnames(cellInfo)=="seurat_clusters")] <- "cluster"
colnames(cellInfo)[which(colnames(cellInfo)=="celltype")] <- "celltype"
cellInfo <- cellInfo[,c("sample","cluster","celltype")]
saveRDS(cellInfo, file="int/cellInfo.Rds")



###设置分析环境
org <- "hgnc" 
dbDir <- "./cisTarget_databases"
myDatasetTitle <- "R_SCENIC_integrated"
data(defaultDbNames)
dbs <- defaultDbNames[[org]]


### 初始化
scenicOptions <- initializeScenic(org=org, dbDir=dbDir, dbs=dbs, 
                                  datasetTitle="HNSCC", nCores=10)  
scenicOptions@inputDatasetInfo$cellInfo <- "int/cellInfo.Rds"
saveRDS(scenicOptions, file= "int/scenicOption.rds")




##基因过滤
#过滤标准是基因表达量之和>细胞数*3%,且在1%的细胞中表达
genesKept <- geneFiltering(exprMat, scenicOptions, 
                           minCountsPerGene = 3 * 0.01 * ncol(exprMat), 
                           minSamples = ncol(exprMat) * 0.01)
exprMat_filtered <- exprMat[genesKept, ]

dim(exprMat_filtered)
#  7320 18578


#移除exprMat等无关紧要的

rm(exprMat)
rm(integrated)
rm()
rm()
rm()
rm()
rm()


#计算相关性矩阵
runCorrelation(exprMat_filtered, scenicOptions) # 7320基因,18578细胞,12核,这一步10mins

#TF-Targets相关性回归分析
exprMat_filtered_log <- log2(exprMat_filtered+1)


#library(future)`           `
#plan()
#plan("multicore", workers = 10)
#options(future.globals.maxSize=1000*1024*1024)##default有最大可使用内存限制,可更改
#detach("package:future")

memory.limit(1000000)
set.seed(1001)
runGenie3(exprMat_filtered_log, scenicOptions,nParts=1000) #  7.8日 20:00开始跑
#需要注意nParts参数,它的作用是把表达矩阵分成n份分开计算,目的是防止数据量大时内存不够。

相关文章

  • 0717

  • 0717

    暴雨两天。 雨来的突然,所以要资源只能去商场里面。 明天会更加努力一点。

  • 0717

    我渴望能见你一面,但请你记得,我不会开口要求要见你。这不是因为骄傲,你知道我在你面前毫无骄傲可言,而是因为,唯有你...

  • 0717

    什么时候才能画好,继续努力坚持

  • 0717

    从西长安街到滨海只要三个小时从今天到明天是二十四小时一夜的等待疲惫、不安 从开始到现在仅仅一年从始至终是一辈子一夜...

  • 0717

    今天一早去会场准备,下午开半年总结会,会后聚餐唱歌,一身疲惫。但也很开心。 洗洗准备睡了,晚安。

  • 0717🐥

    每日行动:阅读《稻盛和夫100条经典语录》;半夜整理卫生;和队友链接;和张张一起画画,讲故事,自制小座椅。 每日收...

  • 0717

    经过昨晚的剧烈对抗,和妈妈说了好多心里的委屈,工作的压力,自己没有办法改变的现状,妈妈倒是很平静的安慰我,我很感谢...

  • 0717。

    员工的表层诉求是结果,深层诉求是想要成长,因为只有成长能够带来持久的结果最大化。 管理者的表层目的是结果最大化...

  • 0717

    因为每天和固定的人交谈,得到的信息也都是相似的,所以脑海中的信息、知识也如同一潭僵化的死水。 这时,和平常不怎么联...

网友评论

      本文标题:runGenie3-临时0717

      本文链接:https://www.haomeiwen.com/subject/xtewudtx.html