美文网首页
R读取gmt文件

R读取gmt文件

作者: 生信交流平台 | 来源:发表于2022-02-24 21:34 被阅读0次

前面我们简单介绍过什么是gmt文件,基因矩阵转置文件格式(* .gmt)。今天我们就用R来去读gmt文件。

首先我们从GESA(https://www.gsea-msigdb.org/gsea/downloads.jsp)的官网上,下载一个gmt文件。这里以KEGG的gmt文件为例,其他gmt文件的读取方法一样。

c2.cp.kegg.v7.0.symbols.gmt这个文件里面保存的是基因的名字,

而c2.cp.kegg.v7.0.entrez.gmt这个文件里面保存的是基因的Entrez gene id,

Entrez gene id一般是以一串数字代表一个基因,这串数字直接贴到NCBI里面就可以查找到对应的基因名字了。

下面我们会用两种不同的方法来将KEGG symbol的gmt文件读到R里,并转换成列表。由于gmt文件的每一行都是不一样长的,所以传统的read.table在这里是毫无用武之地的。

方法一:

    x <- readLines("c2.cp.kegg.v7.0.symbols.gmt")

该方法会将KEGG通路的名字作为列表中每个元素的名字,然后将前两列删掉,剩下的基因名字作为列表的元素

方法二:

   dat = readLines("c2.cp.kegg.v7.0.symbols.gmt")

该方法,会保留gmt文件中的所有信息,结果会生成一个复杂的数据结构,列表里面嵌套列表。res为列表,长度为3,分别保存genesets,KEGG通路名字和数据来源,而geneset也是一个列表,里面保存186条KEGG通路上的所有基因名字。

基因集富集分析(Gene Set Enrichment Analysis, GSEA)

相关文章

  • R读取gmt文件

    前面我们简单介绍过什么是gmt文件,基因矩阵转置文件格式(* .gmt)[https://link.zhihu.c...

  • 对象何必到处乱找,自己创造即可

    以下代码需要加载 GSEABase 包: 读取gmt文件看看GeneSetCollection 对象 自己去下载 ...

  • R语言 读取文件

    1. R读取txt文件 使用R读取txt文件直接使用read.table()方法进行读取即可,不需要加载额外的包。...

  • Node.js(三):常见模块

    1、fs模块 readFile读取文件: writeFile写文件: flag传递的值,r代表读取(read)文件...

  • 算法技术面

    . R语言的文件读取:csv文件的读取方式(read.csv),txt文件的读取方式(read.table) 2....

  • Python.IO之简易的文件操作

    IO 文件读取 '''打开文件(读取)练习。#尤其要注意编码''' '''r+是r模式的拓展,既包括读也包括写,用...

  • R语言读写R格式文件2021.2.24

    1、读取R格式文件 1.1 读写RDS格式文件 1.1.1 导出RDS文件 1.1.2 读取RDS文件 直接双击已...

  • 2018-08-19

    在运行rsem-to-matrix是会出现R读取文件错误 下面是在网上找的答案R语言读取文件错误 所以将 /ho...

  • R语言与生信应用14-R语法-R文件操作2

    R文件操作2 读取数据 R中有很多函数可以读取数据 read.table, read.csv用来读取制表符分隔的数...

  • 爬虫_014_文件操作

    (1)读文件 r方法1:直接读取所有内容。这种写法不推荐,因为是整个文件全部都读取 方法2:循环读取文件。这是读文...

网友评论

      本文标题:R读取gmt文件

      本文链接:https://www.haomeiwen.com/subject/zcstrrtx.html