美文网首页生信猿
【数据库-5】ESP6500

【数据库-5】ESP6500

作者: oddxix | 来源:发表于2018-11-23 14:08 被阅读0次

    欢迎关注:oddxix
    如果觉得写的不错记得点个赞~


    1.简介

    官网:http://evs.gs.washington.edu/EVS/

    首页

    ESP全称是NHLBI GO Exome Sequencing Project(国家心肺和血液研究所外显子组测序计划),包含了SNP和InDel变异。通过注释可以找到突变在ESP6500中的变异频率。主要目的是通过NGS技术对不同人群进行SNP分型,来辅助心脏,肺,血液相关疾病的研究。目前有6503个样本:

    ESP6500共包含了7个项目,分别由不同的机构承担:

    • Seattle GO - University of Washington, Seattle, WA

    • BroadGO - Broad Institute of MIT and Harvard, Cambridge, MA

    • WHISP - Ohio State University Medical Center, Columbus, OH

    • Lung GO - University of Washington, Seattle, WA

    • WashU GO - Washington University, St. Louis, MO

    • Heart GO - University of Virginia Health System, Charlottesville, VA

    • ChargeS GO - University of Texas Health Sciences Center at Houston


    2.使用

    通过首页的Data Browser按钮,可以检索数据库。可以通过以下4种方式进行检索:

    • HUGO命名的gene symbol

    • Entrez Gene ID

    • 染色体区域

    • dbSNP rs ID

    以EGFR为例,搜索后,

    点击display


    2.1基因相关信息

    这部分内容会给出基因的symbol, ID,染色体区域等基本信息,还会给出pathway, COSMIC, STRING, OMIM等数据库的链接


    2.2通过单选框,对变异位点的表头进行筛选


    2.3 变异位点的详情页面

    根据前面筛选的表头,展示每个变异位点对应的信息。不同类型的变异位点填充色是不同的,颜色和变异类型的对应关系如下:


    2.4选择覆盖度

    可以链接到UCSC上查看EGFR 基因的各种信息,或者下载查看所有位点的覆盖信息


    2.5 下载

    检索的结果可以下载,点击右上角的download按钮即可下载,支持textvcf两种格式。

    除了检索之外,还可以一次下载整个数据库中的内容,点击首页的Download按钮即可跳转到下载页面。

    该页面提供的数据是对6503例样本的分析结果,变异位点的位置是基于hg19版本的,为了适配hg38版本,新增了字段来存储hg38版本上的位置信息。提供了5个文件供下载,可以分成3类

    1.SNP分型结果

    ESP6500SI-V2-SSA137.GRCh38-liftover.snps_indels.txt.tar.gz
    ESP6500SI-V2-SSA137.GRCh38-liftover.snps_indels.vcf.tar.gz

    2.测序覆盖度结果

    ESP6500SI-V2.GRCh38-liftover.coverage.all_sites.txt.tar.gz
    ESP6500SI-V2.coverage.seq_blocks.txt.tar.gz

    3.外显子目的区域文件

    agilent_nimblegen_exome_targets_esp_project.tar.gz

    通常情况下,下载VCF文件就可以。

    相关文章

      网友评论

        本文标题:【数据库-5】ESP6500

        本文链接:https://www.haomeiwen.com/subject/vsljqqtx.html