欢迎来到"bio生物信息"的世界
1 前言
尽管之前已经有很多的数据库收集了enhancers,比如EnhancerAtlas
、 VISTA Enhancer Browser
、FANTOM5
、 DENdb
、 dbSUPER
、SEA
,但这些数据大部分是通过方法、模型推断的,因此其是否有真实的enhancers或promoters活性则需要打个折。
下面简要介绍一个公共数据库RAEdb(http://www.computationalbiology.cn/RAEdb/index.php#),这个数据库的优点是实打实的汇集了大规模的实验数据。
RAEdb
主要收集的数据有STARR-seq
和MPRA
数据。
截至目前为止,该网站包含500,000 个enhancers 、7500 个 Epromoters 、55 个样本、8 项研究。
STARR-seq:该方法是用来评估启动子区域的增强子活性。
Epromoters: 指的是既可以作为promoters 同时可以作为远端基因的enhancers
2 鉴定enhancers和epromoters的流程
enhancers和epromoters的鉴定流程如下图:
主要是从GEO数据库搜集目前已发表的STARR-seq
和MPRA
数据,然后分别进行Enhancer peak calling ,鉴定具有enhancers和Epromoters活性的序列。
3 RAEdb数据库的功能种类
下图是RAEdb数据库所包含的功能种类。
微信图片_20200405154308.png
第一个功能是可以浏览、查阅。查阅的方式多样,可以是按照研究队列的方式,也可以是按照序列、基因、位置等方式。
微信图片_20200405153907.png我测试了一下,这个网站的查询方式不是很灵活,他们是按照匹配度查询的。
比如1号染色体的9975360-9975398序列有enhancer活性,如果输入9975363,则显示查询不出来。当输入9975时,则有结果。
第二个功能是可以在基因组上可视化enhancers、histone modification。
第三个功能是可以下载,该网站提供了FASTA和BED两种格式,按照研究队列下载。
今天的推荐就讲到这里,如果你研究的SNP刚好在基因间隔区,又刚好找不到它有什么功能报道,那就试试这个网站,说不定有惊喜哦。
网友评论