今天写写我们自己做的数据库,欢迎大家提意见,多引用。
长链非编码RNA是一类广泛存在、长度大于200 个碱基的非编码调控分子。它深度参与植物生长发育、逆境胁迫与次生代谢等诸多生命过程,是当前生物学研究的热点领域。
长链非编码RNA是一类无蛋白编码能力或编码能力极低的RNA转录本,通过靶标模拟、转录干扰、甲基化等机制调控真核生物基因表达。随着高通量测序技术的发展,越来越多的研究表明,长链非编码RNA在植物中广泛存在。目前拟南芥、水稻、玉米、小麦、番茄等重要植物均已开展全基因组长链非编码RNA的鉴定与研究。此前,国际上虽然有包括lncRNAdb、NONCODE、EVLncRNAs、PLNlncRbase、CANTATAdb、GreeNC等在内的多个植物长链非编码RNA相关数据库被成功开发并投入使用,但现有数据库或多或少地均存在注释标准不统一,缺乏包括表达量、靶基因、表观遗传学等重要信息的种种不足。
自从我们第一个版本发布之后(Jin et al, 2013 Bioinformatics),就获得了大量的访问。为创造性地开发一套更为科学系统、精准实用的百科全书式长链非编码RNA数据库,我们自NCBI公共数据库搜集整理的80种重要植物的13834个转录组测序数据(图1A),开发了适用于植物全基因组长链非编码RNA的鉴定分析流程(图1B),在全面整合其他现有资源的基础上,鉴定了1246372个植物长链非编码RNA(含31028个烟草长链非编码RNA),开发了植物长链非编码RNA数据库PLncDB(http://plncdb.tobaccodb.org/)(Jin et al, 2020, NAR)。

数据库可实现植物长链非编码RNA基因组位置、序列、结构、表达、表观遗传、调控网络等信息的全方位查询与可视化展示。同时,5个搜索引擎及JBrowse、eFP Browser、EPexplorer等分析工具,为数据库提供了强大的数据分析能力(图2)。作为一站式数据库,PLncDB将为植物与烟草长链非编码RNA研究提供更为精准、全面的大数据分析平台支撑。

欢迎大家多多引用,提意见。
网友评论