根据转录组和KEGG代谢基因计算通路活性

作者: pudding815 | 来源:发表于2023-12-06 10:13 被阅读0次

5分钟看懂KEGG代谢通路图
绘制差异基因kegg注释图
转录组测序技术和结果解读（五）——参考基因组mapping
多组学联合分析案例
【单细胞转录组】KEGG通路反推基因列表
利用KEGG查询多个基因的信号通路
2020-10-31 .小组Day7笔记
转录组分析---step1 counts分布检查
R-下载某一条通路的所有基因名字（KEGG）
2022-06-03如何快速分析植物激素通路相关基因

！！！计算方法是以前初师兄根本文献扒的，后续把文章doi附上
！！！KEGG基因list,利用R可以很快扒下来，我后面再更新，百度一下你就知道

准备好转录组表达矩阵，KEGG基因list

step1:构建代谢基因表达矩阵

library(dplyr)
#读入表达矩阵
tpm <- read.csv("tpm.csv")
#读入代谢基因list
all <- read.csv("allgenelist.csv")
#构建代谢基因list表达矩阵
all_tpm <- all %>% left_join(y=tpm,by="gene_name")

全部代谢基因表达矩阵.png

step2：标准化代谢基因表达矩阵并加权

###标准化，即按行求均值，
ave <- rowMeans(all_tpm)
all_tpm_ave <- all_tpm/ave
write.csv(allgene_tpm_ave,"allgene_tpm_ave.csv")
##输出后，用excel打开，在gene_name前加一列countif,统计该基因在代谢list中出现的次数，即权重
#psR里这一步我还没不知道怎么计数，excel简单些，后续在改

加权后表达矩阵.png

step3：通路活性计算

关注通路的位置在第2523:2540行.png

#读入上述加权后表达矩阵
data<- read.csv("allgene_tpm_ave.csv")
#根据初师兄的表选取通路的行号2523:2540行
Pantothenate_and_CoA_biosynthesis <- data[2523:2540,]
###计算score
pathway_step1 <- colSums(Pantothenate_and_CoA_biosynthesis[,4:227]/Pantothenate_and_CoA_biosynthesis$countif)
pathway_step2 <- colSums(Pantothenate_and_CoA_biosynthesis[4:227])
SCORE <- as.data.frame(t(pathway_step1/pathway_step2))
write.csv(SCORE,"SCORE.csv")