基因组学数据分析常用的在线资源

作者: BryceBryce | 来源:发表于2017-11-18 12:34 被阅读106次

    奋斗在人类组学数据分析的一线,要随时跟上最新的研究进展。大型的研究项目会有全面的数据集和可视化工具,也有专门从各个数据源收集数据整合而成的数据库。手头备几个,方便查阅。

    Genetic和Epigenetic数据查询与下载

    GeneCards (http://www.genecards.org/) 使用125个数据源对人类基因组基因进行详细注释

    ENCODE data portal (https://www.encodeproject.org/)

    • ENCODE Phase 3和ENCODE Phase 4的数据库
    • 常用细胞系和组织的各类组学数据

    ENCODE Downloads (http://genome.ucsc.edu/encode/downloads.html)

    • ENCODE phase 2数据下载页面

    ICGC Data Portal (https://dcc.icgc.org/) 最全的癌症项目数据库,包含TCGA的数据

    COSMIC (http://cancer.sanger.ac.uk/cosmic) 人工注释癌症样本中的Somantic Mutation大全

    BioMart (https://www.ensembl.org/biomart/martview/1fbe827446e53d1a0f34002043ac4dfa) 在线注释基因组信息(R中有biomaRt包实现同样功能)

    Firebrowse (http://firebrowse.org/) TCGA数据分析展示的工具

    非编码基因组(noncoding genome)的相关数据库
    • 随着ENCODE计划从Phase 2到Phase 4不断推进,大家发现基因组绝大部分是不编码的,再加上基因编辑技术更新换代,这些nocoding genome的功能研究一直如火如荼。从短的(miRNA,siRNA等)到长的(lncRNA),再到成环的(circRNA),无所不能...

    Noncode (http://www.noncode.org/) 陈润生院士课题组开发的,网站功能全面

    Lncipeda (https://lncipedia.org/) 数据来源十分广泛

    Lncrnadb (http://lncrnadb.com/) 完全手动收集,每一个条目有对应文献

    GWAS Catalog (https://www.ebi.ac.uk/gwas/) 完全手动收集的GWAS SNP,每一个有对应文献

    基因组浏览器

    UCSC genome browser (https://genome.ucsc.edu/)

    • 人类基因组计划时代开发的browser,页面较简陋,但数据仍在不断更新

    WashU Browser (http://epigenomegateway.wustl.edu/)

    • 云端有ENCODE项目和Roadmap项目的全部数据
    • 可以上传自己的数据,也有截图功能产生矢量图片
    • 支持三维基因组学数据的可视化(比如Hi-C和ChIAPET)

    IGV (http://www.igv.org/) 包括桌面浏览器和javascript两个版本

    • 桌面浏览器本地运行,适合可视化大文件(如bam文件),也可以加载来自ENCODE, TCGA,1000 Genomics的云端数据
    • javascript版本IGV.js可以直接嵌入其他web应用里

    HiGlass (http://higlass.io/) 4D Nucleome项目官方浏览器

    • 不仅能可视化组学数据(比如ChIP-Seq和RNA-Seq),还支持Hi-C交互矩阵的可视化
    常用软件

    OMICTools (https://omictools.com/) 生物信息学软件收集

    Bioconductor (https://www.bioconductor.org/) 生物信息学R package大本营

    问答社区

    Biostars (https://www.biostars.org/) 软件报错的时候

    SEQanswers(http://seqanswers.com/) 软件报错的时候

    Stackoverflow (https://stackoverflow.com/) 代码报错的时候

    在线课程

    Bioinformatics Specialization UCSD开设的计算生物学课程,从算法角度解决生物学问题

    Data Analysis for Life Sciences 哈佛开设的统计分析课程,针对生命科学背景的研究人员

    暂时想到的就是这么多,以后再更新...

    相关文章

      网友评论

      本文标题:基因组学数据分析常用的在线资源

      本文链接:https://www.haomeiwen.com/subject/bqeevxtx.html