美文网首页RNA-seq
基因矩阵转置文件格式(* .gmt)

基因矩阵转置文件格式(* .gmt)

作者: 生信交流平台 | 来源:发表于2022-02-20 09:57 被阅读0次

gmt文件可能对于很多人来说比较陌生,但是对于使用GSEA(https://www.gsea-msigdb.org/)做过基因富集分析的人应该并不陌生。

gmt(Gene Matrix Transposed,基因矩阵转置)文件,里面保存的是一些基因列表的信息。每一行代表一个基因列表,基因之间以制表符隔开。下面是一个gmt文件的示例。第一列是基因列表的名字,第二列一般是描述信息,说明这套基因列表从哪里收集的,也可以为空或者用NA表示。从第三列开始,每一列是一个基因的名字。每一行的长度可以不一致,也就是说每一个基因列表中包含的基因数可以不一样。

在GSEA的官网上(https://www.gsea-msigdb.org/gsea/downloads.jsp

将所有的基因集划分为以下8大类

1. H: hallmark gene sets

该类别包含了由多个已知的基因集构成的超基因集,每个H类别的基因集都对应多个基础的其他类别的基因集。

2. C1: positional gene sets

该类别包含人类每条染色体上的不同cytoband区域对应的基因集合。根据不同染色体编号进行二级分类。

3. C2:curated gene sets

该类别包含了已知数据库,文献和专家支持的基因集信息,包含下面5个二级分类

4. C3 : motif gene sets

该类别包含了miRNA靶基因和转录因子结合区域等基因集合

5. C4 : computational gene sets

该类别包含计算机软件预测出来的基因集合,主要是和癌症相关的基因

6. C5 : GO gene sets

该类别包含了Gene Ontology对应的基因集合,分为以下3大类别

7. C6 : oncogenic signatures

该类别包含已知条件处理后基因表达量发生变化的基因,

8. C7 : immunologic signatures

该类别包含了免疫系统功能相关的基因集合。

下期我们将来谈谈如何用R读取gmt文件,为后续富集分析做准备。

基因集富集分析(Gene Set Enrichment Analysis, GSEA)

相关文章

  • R读取gmt文件

    前面我们简单介绍过什么是gmt文件,基因矩阵转置文件格式(* .gmt)[https://link.zhihu.c...

  • 基因集富集分析(Gene Set Enrichment Anal

    前面简单介绍过基因矩阵转置文件格式(* .gmt)[http://mp.weixin.qq.com/s?__biz...

  • 基因矩阵转置文件格式(* .gmt)

    gmt文件可能对于很多人来说比较陌生,但是对于使用GSEA(https://www.gsea-msigdb.org...

  • WGCNA基因表达矩阵离群值去除

    datExpr为基因表达矩阵的转置矩阵:行是样本名字,列是基因名 查看是否有离群样品 sampleTree = h...

  • 2019-02-22 Day 48 待提高

    1.转置矩阵 给定一个矩阵 A, 返回 A 的转置矩阵。 矩阵的转置是指将矩阵的主对角线翻转,交换矩阵的行索引与列...

  • 机器学习里的数学基础——矩阵论

    1. 基本概念 1.1 向量及其转置 一个维列向量及其转置可记作: 1.2 矩阵及其转置 一个的矩阵及其的转置矩阵...

  • 正交矩阵

    转置矩阵为其逆矩阵。

  • 2019-03-13

    矩阵的转置则称 为A的转置,记为 设为矩阵,则为 矩阵 为对称矩阵,则 为反对称矩阵,则 为n阶方阵,,为对称矩阵...

  • 矩阵

    参考资料转置矩阵伴随矩阵

  • 12、转置矩阵

    1、题目如下: 给定一个矩阵 A, 返回 A 的转置矩阵。 矩阵的转置是指将矩阵的主对角线翻转,交换矩阵的行索引与...

网友评论

    本文标题:基因矩阵转置文件格式(* .gmt)

    本文链接:https://www.haomeiwen.com/subject/xzimlrtx.html