美文网首页生物信息学
遗传病分析之有害性预测利器- InterVar

遗传病分析之有害性预测利器- InterVar

作者: bioYIYI | 来源:发表于2020-04-06 21:06 被阅读0次

    软件名:InterVar
    版本号:0.1.7

    1. 软件用途综述

    InterVar是一种生物信息学软件工具,用于通过ACMG / AMP 2015指南对遗传变异进行临床解释。 InterVar的输入是从ANNOVAR生成的注释文件,而InterVar的输出是将变体分类为“良性”,“可能良性”,“不确定重要性”,“可能致病性”和“致病性”码。 2015 年美国医学遗传学和基因组学学会(ACMG) 开发了针对序列变异的解读的标准和指南, 。 ACMG 开发的变异分类系统并推荐使用特定的标准术语,该系统将变异分为 pathogenic(致病的 ) 、 likelypathogenic(可能致病的) 、 uncertain significance(致病性不明确的) 、 likely benign(可能良性的) 、 benign(良性的) 来描述孟德尔疾病致病基因中发现的突变。 ACMG 的变异分类系统中共有 28 个证据类别,根据 28 个证据的组合形式进行变异位点的有害性分类。

    网址:https://github.com/WGLab/InterVar

    2. 分析原理

    王凯教授开发这款疾病变异分析解读工具 InterVar旨在帮助遗传病数据解读人员 更高效地应用2015版ACMG指南的28条评估标准,能够对海量变异位点信息实现半自动化分析(18条自动,10条需要手动调整),加快遗传病基因分析和诊断速度。下图是intervar的工作流程:变异位点信息输入,软件对变异初步判读分类,手动调整必要条件后,得到最终判读结果。


    image.png

    3. 实现方法

    3.1 使用示例

    python /*/bin/InterVar/InterVar-master/Intervar.py
    -b hg19
    -i /*/bin/InterVar/InterVar-master/example/test.hg19_multianno.txt
    --input_type=AVinput
    -o /*/bin/InterVar/InterVar-master/example/test
    --table_annovar /*/Software/Annovar_201602/table_annovar.pl
    --convert2annovar /*/Software/Annovar_201602/convert2annovar.pl
    --annotate_variation /*/Software/Annovar_201602/annotate_variation.pl
    -d /*/bin/InterVar/test/humandb/
    -t /*/bin/InterVar/InterVar-master/intervardb
    --skip_annovar
    

    3.2 程序说明

    该程序可以输入文件可以是VCF格式(单样本或者群体均可)或者是AVinput格式,该程序可调用ANNOVAR进行注释,故可接受未注释的文件,也可以接受注释后的文件,主要参数说明如下

    -b 基因组版本;
    -i 输出文件,vcf格式或者AVinput格式(完成ANNOVAR注释或者未完成ANNOVAR注释均可)
    --input_type输入文件格式
    -o 输出文件前缀
    --table_annovar=./table_annovar.pl table_annovar.pl脚本路径
    --convert2annovar=./convert2annovar.pl convert2annovar.pl脚本路径
    --annotate_variation=./annotate_variation.pl annotate_variation.pl脚本路径
    -d humandb, --database_locat=humandb annovar注释数据库路径
    --skip_annovar 基于现有的注释结果,不重新进行注释

    3.3软件参数详细说明

    *Usage: Intervar.py [OPTION] -i INPUT -o OUTPUT ...*
     *Intervar.py --config=config.ini ...*
    *Options:*
     *--version* *输出版本信息并退出*
     *-h, --help**显示帮助信息并退出*
     *-c config.ini, --config=config.ini* *配置文件,可以将所有的参数都写到配置文件中*
     *-b hg19, --buildver=hg19* *基因组版本,目前支持**GRCh37 hg18**,后期会支持* *GRCh38*
     *-i example/ex1.avinput, --input=example/ex1.avinput* *包含变异的输入文件*
     *--input_type=AVinput* *输入文件的格式,可以是**AVinput**、**VCF(**单样本**sample)**、**VCF_m(**多样本**)*
     *-o example/myanno, --output=example/myanno* *输出文件的前缀*
     *InterVar Other Options:*
     *-t intervardb, --database_intervar=intervardb InterVar**自带数据库*
     *-s your_evidence_file, --evidence_file=your_evidence_file* *用户自己构建的证据*
     *Annovar Options:*
     *--table_annovar=./table_annovar.pl table_annovar.pl**脚本路径*
     *--convert2annovar=./convert2annovar.pl convert2annovar.pl**脚本路径*
     *--annotate_variation=./annotate_variation.pl annotate_variation.pl**脚本路径*
     *-d humandb, --database_locat=humandb annovar**注释数据库路径*
     *--skip_annovar* *基于现有的注释结果,不重新进行注释*
    

    3.4 结果展示及说明

    1) Chr:染色体
    2) Start:变异位点在染色体上的起始位置
    3) End:变异位点在染色体上的终止位置
    4) Ref:参考基因组碱基型
    5) Alt:样本基因组碱基型
    6) Ref.Gene:基于refGene注释的基因名称,列出该变异所在的基因
    7) Func.refGene:对变异位点所在的区域进行注释
    8) ExonicFunc.refGene:外显子区的SNV 或 InDel变异类型
    9) Gene.ensGene:基于ensembl注释的基因号
    10) avsnp147: dbSNP数据库关于该位点的描述
    11) AAChange.ensGene:基于ensembl的氨基酸改变注释结果
    12) AAChange.refGene:基于refGene的氨基酸改变注释结果
    13) Clinvar: Clinvar:clinvar注释
    14) Intervar: InterVar and Evidence:intervar关于ACMG的注释
    15) Freq_ExAC_ALL:ExAC_ALL数据库中的次等位基因频率
    16) Freq_esp6500siv2_all:ESP6500数据库中的次等位基因频率
    17) Freq_1000g2015aug_all:千人数据库中的次等位基因频率
    18) CADD_raw:CADD初始分值
    19) CADD_phred:CADD_Phred分值
    20) SIFT_score:SIFT分值,表示该变异对蛋白序列的影响。
    21) GERP++_RS:注释变异位点的保守性的GERP++_RS分值
    22) phyloP46way_placental:
    23) dbscSNV ADA_SCORE和dbscSNV RF_SCORE:dbscSNV数据库的ADA分值
    24) dbsc SNV _RF_SCOR:是一个关于splicing区的变异注释数据库,基于不同算法给出Ada 和RF分值,作者建议使用0.6作为阈值。
    25) Interpro_domain:蛋白序列和蛋白分类数据库interpro中关于结构域的注释
    26) AAChange.knownGene:基于ncbi的氨基酸改变注释结果
    27) rmsk:rmsk数据库注释结果
    28) MetaSVM_score:dbNSFP数据库整合的预测分值
    29) Freq_ExAC_POPs:
    30) OMIM:OMIM数据库注释的疾病号
    31) Phenotype_MIM:基于OMIM的表型注释
    32) OrphaNo.:注释Orphanet号
    33) Orpha:Orpha库注释内容
    34) Otherinfo:其他信息
    

    4. 注意事项

    a) ANNOVAR必须是2016-02-01以后的版本。
    b) Python >=2.6.6.(实测部分功能需要python3)
    c) 需要提前从OMIM数据库中下载 mim2gene.txt (2016-09以后的)文件,并拷贝到软件自带的数据库目录内.
    d) 当选用--skip_annovar参数跳过ANNOVAR注释时,-i和-o参数需要有相同的路径相同的文件前缀,且该步仅可在python3上完成。

    5. 软件相关文献引用

    Am J Hum Genet. 2017 Feb 2;100(2):267-280. doi: 10.1016/j.ajhg.2017.01.004. Epub 2017 Jan 26.InterVar: Clinical Interpretation of Genetic Variants by the 2015 ACMG-AMP Guidelines. Li Q(1), Wang K(2). Author information: (1)Zilkha Neurogenetic Institute, University of Southern California, Los Angeles, CA 90089, USA

    相关文章

      网友评论

        本文标题:遗传病分析之有害性预测利器- InterVar

        本文链接:https://www.haomeiwen.com/subject/uieiphtx.html