NOTE:
所有Tombo命令也可用于DRS reads,但必须为剪切的转录本提供转录组参考序列。
运行tombo-h查看所有tombo命令,
运行tombo [command group] -h查看每个组中的所有命令,
并运行tombo [command group] [comand]-h获取每个tombo命令参数的帮助。
Tombo当前无法处理spliced alignments。因此,处理RNA数据需要为具有剪接转录产物的生物体提供transcriptome (NOT genome) reference。
在Tombo框架内处理RNA数据需要特别小心。在进行RNA处理时要考虑的主要事项是必须提供转录组参考,因为不支持spliced mapping。Tombo框架中缺少剪接映射支持是识别修饰RNA碱基的一个有意识的决定。这是因为转录组是检测修饰RNA碱基的自然环境。
当修饰的RNA碱基投射到基因组参考上时,任何潜在的转录isoform特异性修饰信息丢失或信号被稀释。保留亚型特异性修饰碱基检测的可能性是选择强制将修饰碱基映射到转录组的一个原因。备选外显子边缘的区域也有不同的预期信号水平,因此,这些位置计算的基因组统计数据将很难处理成逻辑输出。加工过程也会对映射splice boundaries的位移非常敏感,这可能随nanopore reads而变化。
研究isoform特异性修饰碱基的工具是Tombo框架内的未来目标。这确实给Tombo RNA数据的下游处理带来了一些信息挑战。推荐的Tombo RNA处理pipeline将很快发布在这里,以帮助整合性修饰RNA处理 与其他基因组生物信息学工具更加简化。
第二个次要注意事项是,由于RNA目前在3'到5'方向上测序;因此,在访问Tombo re-squiggled 的原始信号数据时,必须特别小心。原始信号(来自MinKNOW)和称为albacore碱基的事件以与基因组相反的方向存储(3'到5'的reads 映射到正基因组链)。出于几个实际原因,RNA数据的Tombo事件以相反的方向存储(对应于基因组链序列方向,而不是测序时间方向)。因此,如果要将Tombo事件与原始信号进行比较,则必须反转原始信号。Tombo RNA模型也存储在这个方向上,因此与在序列时间方向上处理数据的一些其他RNA HMM信号水平模型相比,可能被认为是反向的。
RNA Processing Workflow
由于Tombo RNA处理带来了独特的信息挑战,推荐的处理pipeline将很快发布在这里。
该pipeline适用于希望处理来自基因组序列参考和基因注释文件(GTF或GFF)的样本的用户。对于成功处理转录组 reference数据的用户,此处理workflow将不适用。
该管道旨在解决RNA修饰碱基检测的大多数用例,即将Tombo结果移植到与基因组浏览器兼容的格式。请尽快回来查看推荐的Tombo RNA处理管道!
这条pipeline可能会建在R/bioconductor ensembldb包上。该软件包允许创建自定义数据库以及基因组和转录组坐标之间的映射。为了将Tombo RNA结果投影到基因组坐标空间,建议使用该软件的功能。不久将提供基于此包的完整Tombo pipeline的完整教程/示例脚本。
网友评论