UCSC(University of California Santa Cruz)作为生物领域里常用的数据库之一,整合了各大数据库的基因注释、基因表达、调控、变异等等各种基因组数据信息,不仅可以可视化浏览和数据挖掘,还能下载用于生信分析的fasta、GTF或BED文件和比较作图,听到这里,研究转录调控并且手里有感兴趣基因的老师是不是想问:这个数据库能找到可能调控我的目标基因的转录因子吗?可否来个“栗子”尝一尝?下面就以DUSP2为例,让小编带大家体验一下查找过程~
STEP 1:首先在Genomes中选定物种及参考基因组版本,输入感兴趣的基因名称DUSP2,点击“GO”;
STEP 2:确认基因信息后点击进入GenomeBrowser界面,如图默认显示该段基因序列上的数据信息,并且可通过zoom out和zoom in缩放视图;
STEP 3:怎么没有看到我想要的转录因子呢?不要着急,我们可以先点击“3X”zoom out放大一下视野,然后track图下方找到“configure”,点击即可跳转到新界面;
STEP 4:在新界面找到“Regulation”将自己感兴趣的转录因子(或者也可以添加组蛋白修饰及其他调控元件)栏设置成“full”,点击“submit”后就会在GenomeBrowser的视图中添加显示组蛋白修饰或者转录因子的track。
过程是不是非常简单,但是要注意哦,这里只是列明ENCOOD数据库中不同样本在该基因序列上不同转录因子结合位点,自己实验样本中转录因子的实际结合情况还得做实验验证。(偷偷告诉你,实验嘉因生物可以帮您搞定哦~)
实操
做生信分析的小伙伴儿都知道,很多分析绘图过程需要使用bed.文件,就想问这里是否能直接下载呢?那就来试试TableBrowser吧,以GM12878细胞1号染色体的96,140,169-96,345,440这段DNA序列上H3K27ac的bed.为例。
首先在Tools中找到TableBrowser点击进入进行设置和查找信息,选定文件格式,输出即可获得对应文件。
其实,除了调控信息,UCSC中还有表达、变异等等关于基因组的很多信息,感兴趣的小伙伴赶紧来自己动手尝试一下吧~
文章转自微信公众号:嘉因生物
网友评论