特点:
1,长度大于200nt,非编码RNA
2,植物 lncRNA 主要由 RNA 聚合酶Ⅱ转录,具有5′帽子和3′多聚腺苷酸加尾
3,本身缺少完整的开放阅读框,正常情况不编码蛋白质
4,ncRNA 在动植物体内的表达水平都较低,在序列的进化上保守性差
植物lncRNA数据库:
1,CANTATA数据库(http://yeti.amu.edu.pl/CANTATA/)
收录了大部分植物的lncRNAs信息, 主要通过软件预测的方式识别植物中的lncRNA,目前收录了39个物种, 是最大的植物lncRNA数据库(Quek等2015);
那我们点开网址进行看看:
image.png
常见的作物都有,但是么有小麦的。
2,GreeNC数据库(http://greenc.sciencedesigners.com/wiki/Main_Page)
收录了植物和藻类的lncRNAs信息(Quek等2015)。
该数据库预测lncRNA的策略较为严格, 主要是:
1,通过与Swiss-Prot蛋白数据库比对, 筛选没有比对上的转录本的方法,
2,或者采用CPC软件预测蛋白编码潜能,
最终取2种方法的并集作为候选的lncRNA数据, 其lncRNA数据分
为high confidence和low confidence。目前收录49个物种的lncRNAs信息。
geng粳稻,小麦,玉米都有
3, NONCODE是一个系统化的数据库(http://www.noncode.org/),
致力于提供非编码RNA尤其是lncRNA最完整的注释(Yi等2015)。
通过收集和整合, 该数据库中的lncRNAs数量从527 336个增加到548 640个, 且数据库物种总数达到17个
image.png
植物的话,只有拟南芥!
4,PlncRNADB (http://bis.zju.edu.cn/PlncRNADB/index.php)
该数据库共包含了拟南芥、白杨、玉米的lncRNAs信息。从
GEO数据库中采集物种对应的RNA-seq测序reads,
通过特殊算法策略组装得到转录本序列, 识别到
lncRNA之后, 通过catRAPID在线服务预测lncRNA
和蛋白之间的相互作用, 这个数据库提供了研究
植物中lncRNA的思路, 其预测lncRNA序列和lncRNA-protein相互作用的方法值得借鉴。
image.png
物种有限,拟南芥,玉米,白杨,好在是打开速度快!
以上纯粹是记录一下,以后用到再翻翻看,这些数据库暂时咱还没时间过,最近就是想把LncRNA
的分析流程走一遍
参考文献:植物长链非编码RNA的生物学功能研究进展
网友评论