欢迎关注”生信修炼手册”!
对于转录因子而言,相关的信息有以下几种
-
transcription factors
-
DNA motifs
-
DNA binding sites
-
target genes
transcription factors表示转录因子的名称,对应的基因,家族,序列等基本信息,DNA motifs代表该转录因子结合区域的保守模式,DNA binding sites代表该转录因子实际的结合区域,target genes代表转录因子调控的靶基因。
footprintDB是一个综合性的转录因子数据库,通过整合多个转录因子相关的数据库,最终构建出一个非冗余的数据集,在该数据库中,存储了transcription factors, DNA motifs, DNA binding sites3种信息。网址如如下
http://floresta.eead.csic.es/footprintdb/index.php
该数据库整合了以下19个数据库中的信息
-
JASPAR
-
CISBP
-
3D-footprint
-
HT-SELEX2
-
UniPROBE
-
HOCOMOCO
-
AthalianaCistrome
-
HumanTF
-
HumanTF2
-
AthaMYB
-
FlyZinFinger
-
SMILE-seq
-
ArabidopsisPBM
-
Athamap
-
DBTBS
-
RegulonDB
-
DrosophilaTF
-
humanC2H2ZF-Chip
-
EEADannot
每个数据库的版本,转录因子数量等统计信息详见以下链接
http://floresta.eead.csic.es/footprintdb/index.php?databases
数据库中的全部信息统计如下
该数据提供了检索功能,可以检索transcription factors, DNA binding Motifs, DNA binding sites的信息,示意如下
以转录因子FOXP2_HUMAN
为例,结果如下
1. Transcription Factor
包含了转录因子对应的基因,物种,蛋白编号,蛋白序列, 序列, motif, binding sites 等信息。
2. DNA Binding Motif
包含了motif的编号,对应的物种,一致性序列,sequence logo, PSSM矩阵,binding sites 等信息。
3. DNA binding Sites
包含了结合位点的编号,序列,对应的motif和转录因子等信息。
除了检索功能外,该数据库还提供了motif compare的功能,输入一个motif的PSSM矩阵或者binding区域的序列,可以将该motif与数据库中已有的motif比对,确定是否为已知的motif, 示意如下
这个功能运行时间会很久,建议提供邮箱,运行完毕后会将结果发送到与邮箱里。
通过footprinDB这种整合型的数据库,可以省去在多个数据库之间交叉检索的烦恼,提高检索效率,这种类型的数据库也是一个流行趋势,更多细节和用法请参考官网的说明文档。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!
网友评论