GSEA文件有8类基因集,基本上可以解决80%-90%用到的问题,当然,我们都还有个性化需求,这个时候就需要我们自己动手啦。
先来观察下GSEA需要的gmt文件格式(h.all.v7.0.symbols.gmt
):

共有3列信息:
第1列:基因集名称(geneset names)
第2列:基因集的URL,(备注:没有URL,直接写“NA”)
第3列:基因集包含的基因
制作gmt文件
假如有这么一列基因

rt <- read.table("gene.txt")
gset <- c("Hallmark_my_geneset","NA",rt$V1)
gset <- gset%>%
as.data.frame() %>%
t()
write.table(gset,file = "Hallmark_my_geneset.gmt",sep = "\t",row.names = F,col.names = F,quote = F)
这样自定义的gmt文件就做好了,下一步就可以愉快的进行GSEA/GSVA/ssGSEA分析喽。

参考链接:
制作自己的gene set文件给gsea软件
网友评论