使用oncotator做突变注释

作者: 因地制宜的生信达人 | 来源:发表于2018-01-17 20:49 被阅读433次

突变注释

功能:vcf格式突变数据进一步注释成maf格式

做过癌症数据分析的童鞋都知道,TCGA里面用maf格式来记录突变!那么maf格式的数据是如何得来的呢,我们都知道,做完snp-calling一般是得到vcf格式的突变记录数据文件,然后再用annovar或者其它蛋白结构功能影响预测软件注释一下,还远达不到maf的近100条记录。

而大名鼎鼎的 broad institute 就规定了maf格式的突变注释文件,他就是利用了十几个常见的已知数据库来注释我们得到的vcf突变记录,通常是对somatic的突变才注释成maf格式的数据!

大名鼎鼎的broadinstitute出品的突变注释工具:

http://www.ncbi.nlm.nih.gov/pubmed/25703262

源码在github: https://github.com/broadinstitute/oncotator

软件官网是: https://www.broadinstitute.org/oncotator/

说明书:

http://gatkforums.broadinstitute.org/gatk/discussion/4154/howto-install-and-run-oncotator-for-the-first-time

需要提前自己下载14G的数据:http://www.broadinstitute.org/~lichtens/oncobeta/oncotator_v1_ds_Jan262015.tar.gz

软件可以在官网下载:

https://github.com/broadinstitute/oncotator/archive/v1.8.0.0.tar.gz

本身也是一个在线工具:

input data数据指南
https://www.broadinstitute.org/oncotator/help/#inputformat

集成了下面所有的分析资源,

而且还提供了API。

Genomic Annotations

  • Gene, transcript, and functional consequence annotations using GENCODE for hg19.
  • Reference sequence around a variant.
  • GC content around a variant.
  • Human DNA Repair Gene annotations from Wood et al.

Protein Annotations

  • Site-specific protein annotations from UniProt.
  • Functional impact predictions from dbNSFP.

Cancer Variant Annotations

Non-Cancer Variant Annotations

因为要下载的数据有点多,我这里就不用自己的电脑测试了,安装过程也很简单的!

相关文章

  • 使用oncotator做突变注释

    突变注释 功能:vcf格式突变数据进一步注释成maf格式 做过癌症数据分析的童鞋都知道,TCGA里面用maf格式来...

  • Swift开发规范

    注释规范 设计描述使用多行注释/***/ 文本注释使用/// 需要对方法参数或返回值做说明时使用option+co...

  • Variant Effect Predictor: Ensemb

    软件说明 Ensembl VEP是一款突变注释文件,但是相关的配置比较困难。这次我们使用conda进行安装,可以跳...

  • Python基础(一): 注释, 变量, 运算符, 输入输出语句

    注释 单行注释: 使用#进行单行注释 多行注释: 使用 ''' ''' 或 """ """ 进行多行注释 特殊注释...

  • Java语言基础

    代码注释 单行注释在注释前加上"//" 多行注释在注释前使用/*在注释后使用*/ 文档注释注释前后/***/ 变量...

  • 2017-05-10

    单行注释、多行注释与文档注释的合理使用 单行注释、多行注释与文档注释的合理使用 单行注释:// 注释内容 多行注释...

  • python的基础知识

    注释 1.注释的分类 注释分为单行注释和多行注释 单行注释: '# 注释信息' 多行注释: 使用三个单引号或者使用...

  • 如何使用KAAS进行KEGG注释

    使用KAAS做KEGG注释 标签: KEGG, RNAseq, bioinformatics 什么是KEGG 中文...

  • test_xia9:匹配vcf多列信息,进行注释

    1、文件1:样本突变文件out.csv 2、cosmic注释文件: hg19_cosmic89_somatic...

  • Python科学计算与数据处理2:最基本的语法

    注释 Python有两种注释方式:单行注释和多行注释。单行注释在语句开头使用(#)号标注,而多行注释则使用成对的三...

网友评论

    本文标题:使用oncotator做突变注释

    本文链接:https://www.haomeiwen.com/subject/psxpoxtx.html