奋斗在人类组学数据分析的一线,要随时跟上最新的研究进展。大型的研究项目会有全面的数据集和可视化工具,也有专门从各个数据源收集数据整合而成的数据库。手头备几个,方便查阅。
Genetic和Epigenetic数据查询与下载
GeneCards (http://www.genecards.org/) 使用125个数据源对人类基因组基因进行详细注释
ENCODE data portal (https://www.encodeproject.org/)
- ENCODE Phase 3和ENCODE Phase 4的数据库
- 常用细胞系和组织的各类组学数据
ENCODE Downloads (http://genome.ucsc.edu/encode/downloads.html)
- ENCODE phase 2数据下载页面
ICGC Data Portal (https://dcc.icgc.org/) 最全的癌症项目数据库,包含TCGA的数据
COSMIC (http://cancer.sanger.ac.uk/cosmic) 人工注释癌症样本中的Somantic Mutation大全
BioMart (https://www.ensembl.org/biomart/martview/1fbe827446e53d1a0f34002043ac4dfa) 在线注释基因组信息(R中有biomaRt包实现同样功能)
Firebrowse (http://firebrowse.org/) TCGA数据分析展示的工具
非编码基因组(noncoding genome)的相关数据库
- 随着ENCODE计划从Phase 2到Phase 4不断推进,大家发现基因组绝大部分是不编码的,再加上基因编辑技术更新换代,这些nocoding genome的功能研究一直如火如荼。从短的(miRNA,siRNA等)到长的(lncRNA),再到成环的(circRNA),无所不能...
Noncode (http://www.noncode.org/) 陈润生院士课题组开发的,网站功能全面
Lncipeda (https://lncipedia.org/) 数据来源十分广泛
Lncrnadb (http://lncrnadb.com/) 完全手动收集,每一个条目有对应文献
GWAS Catalog (https://www.ebi.ac.uk/gwas/) 完全手动收集的GWAS SNP,每一个有对应文献
基因组浏览器
UCSC genome browser (https://genome.ucsc.edu/)
- 人类基因组计划时代开发的browser,页面较简陋,但数据仍在不断更新
WashU Browser (http://epigenomegateway.wustl.edu/)
- 云端有ENCODE项目和Roadmap项目的全部数据
- 可以上传自己的数据,也有截图功能产生矢量图片
- 支持三维基因组学数据的可视化(比如Hi-C和ChIAPET)
IGV (http://www.igv.org/) 包括桌面浏览器和javascript两个版本
- 桌面浏览器本地运行,适合可视化大文件(如bam文件),也可以加载来自ENCODE, TCGA,1000 Genomics的云端数据
- javascript版本IGV.js可以直接嵌入其他web应用里
HiGlass (http://higlass.io/) 4D Nucleome项目官方浏览器
- 不仅能可视化组学数据(比如ChIP-Seq和RNA-Seq),还支持Hi-C交互矩阵的可视化
常用软件
OMICTools (https://omictools.com/) 生物信息学软件收集
Bioconductor (https://www.bioconductor.org/) 生物信息学R package大本营
问答社区
Biostars (https://www.biostars.org/) 软件报错的时候
SEQanswers(http://seqanswers.com/) 软件报错的时候
Stackoverflow (https://stackoverflow.com/) 代码报错的时候
在线课程
Bioinformatics Specialization UCSD开设的计算生物学课程,从算法角度解决生物学问题
Data Analysis for Life Sciences 哈佛开设的统计分析课程,针对生命科学背景的研究人员
暂时想到的就是这么多,以后再更新...
网友评论