Risearch分析RNA与RNA之间的互作关系
预测lncRNA和circRNA的靶基因,需要参考RNA与RNA之间的互作结果。在线平台的RNA与RNA之间的互作关系预测也不少,但大多有序列长度限制,对于较长序列如lncRNA和circRNA与mRNA的互作就较难。这次我们使用本地软件Risearch2.1预测RNA与RNA之间的互作关系。
1 下载软件
打开网址:https://rth.dk/resources/risearch/,并点击下载。
Linux系统下可以直接使用已经编译好的risearch2.x文件。在终端进入文件夹,输入./risearch2.x。
2 准备数据
在Ensembl数据库中下载需要分析的RNA的cDNA序列的fasta文件,我们以H19(ENST00000414790.6,lncRNA)和IGF2(ENST00000416167,mRNA)为例,格式如下:
3 分析互作关系
以IGF2作为靶基因,终端运行./risearch2.x -c Homo_sapiens_IGF2_205_sequence.fa -o IGF2.pksuf。
其中-c参数输入靶基因的fasta文件,-o参数为输出文件。
终端运行 ./risearch2.x -q Homo_sapiens_H19_203_sequence.fa -i IGF2.pksuf -s 15 -l 80 -p。
其中-q参数输入lncRNA的fasta文件,-i参数输入上一步的输出文件,-s表示至少连续互补的碱基数,-l表示分析序列长度,-p参数用于可视化配对情况。
结果文件是一个压缩文件,终端运行 zcat *.out.gz > risearch_out.txt解压文件。
4 数据整理
将分析结果进一步整理成表格Risearch_report.xlsx,内容如下:
(1)LncRNA:lncRNA的编号;
(2)Start:lncRNA中预测结合的序列起始位点;
(3)End:lncRNA中预测结合的序列结束位点;
(4)mRNA:mRNA的转录组Ensembl编号;
(5)Gene:mRNA的基因名称;
(6)Start:mRNA中预测结合的序列起始位点;
(7)End:mRNA中预测结合的序列结束位点;
(8)Energe:序列结合的自由能,自由能越低,结合的可能性越高;
(9)Interaction:序列结合的结果,配对信息参考Risearch_result.txt文件,“|”表示成功匹配,“:”表示GU之间的匹配,“ ”表示不匹配。
配对信息进一步整理成Risearch_result.txt文件,内容如下:
每个预测结果包含4行数据,内容如下:
第1行结果为:配对的基本信息包括circRNA的编号、circRNA中预测的序列起始和结束位点、mRNA的转录组编号、mRNA中预测的序列起始和结束位点、互作链和序列结合的自由能;
第2行结果为:circRNA互作区域的序列信息,其中“-”表示未匹配;
第3行结果为:配对的结果,“|”表示成功匹配,“:”表示GU之间的匹配,“ ”表示不匹配;
第4行结果为:mRNA互作区域的序列信息,其中“-”表示未匹配。
网友评论