欢迎关注”生信修炼手册”!
miRNA靶基因预测是研究miRNA功能机制必经的一个环节,现有的相关软件和数据库非常多,然而不同软件的算法各有优劣,在不同数据库之间的交叉检索费时费力,所以需要一个整合多个数据库和软件资源的集成型数据库,mirDIP就是在这样的驱动下产生,集成了30个来源数据库中human相关的靶基因信息,网址如下
http://ophid.utoronto.ca/mirDIP/index.jsp
在Statistics
页面,可以看到详细的来源数据库和对应的数据量信息,示意如下
可以看到,去除冗余之后,共包含27667个基因,2586个miRNA, 约152万条miRNA-target gene信息。
mirDIP不仅仅是做了一个简单的数据整理和去冗余工作,对于来自多个数据库中的靶基因信息,首先对其进行了归一化。将所有靶基因按照可信度从高到底排列,将其归一化到0到1这个区间,0代表可信度最高,1代表可信度最差, 然后利用各个数据库中归一化之后的数值,给出一个总的打分值,公式如下
就是用1减去各个数据库中归一化之后的数值的乘积,根据靶基因对应的score值,划分成了4个范围,示意如下
按照score从大到小排序,前1%称之为Very High
, 接下来依次为High
, Medium
, Low
。
官网提供了以下3种检索方式,可以灵活选择
1. Undirectional search
这种方式直接检索mirDIP中整理好的非冗余数据集,可以根据miRNA ID或者gene symbol进行检索,检索结果示意如下
2. Bidirectional search
这种方式可以根据特定来源数据库对结果进行筛选,示意如下
3. miRNA-gene matrix
这种方式采用matrix的形式展示多个miRNA或者gene的靶基因结果,示意如下
在最后一列会给出共有的miRNA个数,可以用于分析多个miRNA共有的靶基因。
检索结果可以下载,在检索框下方的工具条可以选择下载的格式,支持CSV
和TAB
两种格式,示意如下
该数据库可以免费下载,而且提供了API服务,可以方便的获取数据。
该数据库为miRNA靶基因数据的整合提供了一个良好的参照,可以采用相同的思路来整理小鼠,大鼠等常见物种的靶基因数据库。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!
网友评论