imagelncRNA(long non coding RNA)行发挥功能的方式,目前研究最多的还是ceRNA的功能。经典的ceRNA调控网络是通过lncRNA-miRNA-mRNA来构建的。这个研究思路的话,相对来说已经很成熟了。如果要在这个方面研究的话,其实再加一些变化可能更好一些。毕竟成熟的就代表创新性少一些的。而如果要加变化的话,由于ceRNA调控的原始还是序列的结合。所以最直接能加的还是看基因组变异对于ceRNA调控的影响。所以这次给大家推荐一个基因组变异对于ceRNA调控影响的数据库:LnCeVar(http://www.bio-bigdata.net/LnCeVar)
数据库原理
所谓ceRNA就是一个lncRNA和一个mRNA都可以都可以结合同一个miRNA。由于miRNA和mRNA结合会抑制本身mRNA的表达。由于miRNA表达量是一定的,所以如何一个lncRNA可以结合一定的miRNA的话,那么相当于这个miRNA和目标mRNA结合就少了。然后这个mRNA的表达就增加了。
基于这个原理,这个数据库首先通过几个数据库来预测lncRNA-miRNA可能的调控作用(miRanda, TargetScan, RNAhybrid)。进一步,由使用两个数据库来预测miRNA-mRNA的相互调控作用(TarBase, miRTarBase)。这样寻找同样结合一个miRNA的lnc和mRNA。那就有可能存在ceRNA调控关系,进而就获得了lnc-mi-mRNA的结果了。
PS:其实刚才预测lnc-mi的数据库完全可以用来预测mi-m。主要是TarBase和miRTarBase这两个数据库是基于实验结果来构建的数据库。所以结果更加准确一些。为了考虑结果的准确性就使用这两个数据库了。
作者通过以上方式构建好ceRNA调控网络之后,进一步的来了解基因组变异(SNP, 突变以及拷贝数)对于ceRNA调控网络的影响。对于SNP/突变对于ceRNA的影响,作者也简单的通过评选其结合能的变化来预测的。而是使用了一些测序的数据(千人基因组,TCGA,Cosmic),这样让结果更加的准确一些。
数据库使用
对于数据库的使用的话,如果我们有目标基因的话,那就直接检索就行了。另外这个数据库还提供了查看所有结果的方法。例如我们这里检索:TP53
image我们首先可以看到按照基因组变异分类的TP53的结果:
image点击结果当中的数字,我们就可以看到相关结果的汇总了。例如我们想要查看TCGA数据库当中的突变的结果。那么就点击 41即可。点击之后,我们就可以看到具体的所有汇总信息。同时,我们也可以下载预测到的信息。另外点击每一个结果的Detail。我们就可以看到每一条结果的具体信息。
image点击具体信息之后就可以看到很多相关信息的结果了:
- 每一个具体相关信息的汇总,以及之前时候有文献报道过相关调控信息。
- 突变类型改变的时候,预测到的绑定信息
- 相关调控网络的功能分析的结果
- 相关ceRNA在TCGA当中预后分析的结果。
数据库总结
基本上数据库提供的信息就是这些。这个数据库也提供了下载作用数据的链接。如果需要可以去下载。另外的话,由于数据库对于ceRNA调控网络的预测基于其他数据库的。所以其实今天也就相当于介绍了很多和miRNA相关的数据库了。
其中,miRanda和TargetScan是常规用来预测miRNA靶标的数据库。TarBase和miRTarBase是两者基于收集的具有实验证据的miRNA-mRNA的数据库。这种数据库的结果肯定比单纯的靶标预测要准确的多。同样的准确了也就代表都有人研究过了,可能创新性也就少了一些。而RNAhybrid其实是一个计算两个序列结合能的软件。这个软件是代码行的,如果没有一些shell技巧的话,不建议使用。
网友评论