TIPs:
最近帮一个老师用SPORTS软件分析miRNA(也可以分析其他小RNA)序列的结构特征,可能会用到以下数据库,Few main database source:
mirbase database
rRNA database
GtRNAdb database
mitotRNAdb database
piRBase database
piRNABank
ensembl ncRNA database
rfam database
其中有些数据库中没有我需要的物种数据信息,需要借助其他软件分析提取,例如GtRNAdb database中没有鸽子tRNA信息,因此就需要下面的方法来预测tRNA出来。
推荐两个博客资源:1)https://blog.csdn.net/herokoking/article/details/77853662;2)https://blog.csdn.net/weixin_43569478/article/details/108079199
软件安装和测试
$ wget -c http://eddylab.org/infernal/infernal-1.1.2-linux-intel-gcc.tar.gz
$ tar xzvf infernal-1.1.2-linux-intel-gcc.tar.gz
$ cd infernal-1.1.2-linux-intel-gcc/
$ ./configure --prefix=/user/software/infernal-1.1.2-linux-intel-gcc
$ make && make install
$ cp binaries/* bin
$ wget -c http://lowelab.ucsc.edu/software/tRNAscan-SE.tar.gz
$ tar -xvf tRNAscan-SE.tar.gz
$ mkdir tRNAscan-SE-2.0_installed # 跳过此操作安装在解压目录下也可以
$ ./configure --prefix=/user/software/tRNAscan-SE-2.0_installed
$ make && make install
# 添加bashrc【建议】或者terminal运行
export PATH=/user/software/tRNAscan-SE-2.0_installed/bin:$PATH
export PERL5LIB=/user/software/tRNAscan-SE-2.0_installed/lib:$PERL5LIB
# 需要编辑/user/software/tRNAscan-SE-2.0_installed/bin/tRNAscan-SE.conf文件,每个项目单独拷贝到相应目录下编辑保存
bin_dir:/user/software/tRNAscan-SE-2.0_installed/bin
lib_dir: /user/software/tRNAscan-SE-2.0_installed/lib
infernal_dir: /user/software/infernal-1.1.2-linux-intel-gcc/bin
# 查看帮助说明和具体参数
$ tRNAscan-SE --help
tRNAscan-SE /user/database/GeZi_ncbi_1.0/final.fa -o final.out -f final.ss -s final.iso -m final.stats -b final.bed -c /user/software/tRNAscan-SE-2.0_installed/bin/tRNAscan-SE.conf
# 该命令产生的结果与Demo文件夹中的结果文件类型一致,其中参数
-o 结果文件
-f 二级结构(tRNA)文件
-s (Isotype specific)结果
-m 统计文件(statistics)
-b 输出bed格式结果,也可不设置
结果文件展示
final.out
Sequence Name: 输入的用于预测tRNA的序列名称
tRNA: 预测到的tRNA的个数(第n个)
tRNA Begin: tRNA基因的起始位置
Bounds End: tRNA 基因的终止位置
tRNA Type: tRNA 的类型,该tRNA转运的氨基酸的类型
Anticodon: 反义密码子
Intro Begin: 内含子的起始位置
Bounds End: 内含子的终止位置
Inf Score: cutoff score for reporting tRNAs (default=20)这里输出阈值以上的预测结果
final.out
final.ss
Str 代表的就是二级结构,其中每个< 和每个 > 是配对的,代表在二级结构中这两个碱基是连在一起的。 final.ss
final.iso
tRNAscan-SE 会根据反义密码子和 Isotype Model 两种方法预测tRNA的类型,对于每个tRNA, 分别给出反义密码子和 Isotype Model 预测的结果,以及两种结果预测的一致性,其中isotype model 会对每一种氨基酸进行打分,选得分最高的作为最终的结果 final.iso
final.stats
运行环境、参数等的设置在这里,另外还统计了基因组处理的过程、指标的统计。 final.stats
final.stats
bed输出我没跑,放上demo中的bed,估计我们文件产生的格式与之一致,至于bed文件现在看来作为常识了,自己百度吧。 bed文件
总结
- http://lowelab.ucsc.edu/tRNAscan-SE/index.html 可以网页版运行,很方便,但是注意网页中内置的参数等问题: 网页运行
- 注意tRNA鉴定(search)的模式,或者如果不知道某些参数(score)的涵义等等,可以grep一下。 search score
- 最后,聊以记录我学习该软件的过程,欢迎交流学习!
网友评论