一、软件安装
conda install repeatmasker -c bioconda
二、配置
- 将Repbase解压后放到Libraries下
- 配置
cd /miniconda3/envs/bioinfo/share/RepeatMasker
./configure
先选择trf位置,直接enter,再选择Search Engine,先输入2,RMBlast,再输入5,done。
完成配置,出现一下界面:
![](https://img.haomeiwen.com/i21889244/1f54618806f7deca.png)
三、使用
首先确定数据库中是否收录了目标物种
一些教程是利用./util/queryRepeatDatabase.pl -tree来查看,但我没有找到queryRepeatDatabase.pl文件。
可以参看“RepeatMasker/Libraries/taxonomy.dat”中的物种信息,所有已收录物种的名称都存储在该文件中。
mkdir 00-RepeatMask #提前建立输出目录
nohup RepeatMasker -no_is -e NCBI -species Brassica -pa 6 -html -gff -dir 00-RepeatMask pilon_polished2.fasta &
-species 选择物种
-pa 并行计算
-dir 输出目录
查看系统核数:
grep ^processor /proc/cpuinfo | wc -l
四、报错
报错: blast database error: error: not a valid version 4 database
rmblastn -version
版本为2.2.27+,版本低,用最新版本的rmblastn替换。
从 http://repeatmasker.org/RMBlast.html 下载Pre-compiled Package,并将原来的rmblast替换掉。
wget -c http://repeatmasker.org/rmblast-2.10.0+-x64-linux.tar.gz
tar -zxvf rmblast-2.10.0+-x64-linux.tar.gz
cd ~/miniconda3/envs/bioinfo/bin
rm rmblastn
cp ~/rmblast-2.10.0/bin/rmblastn .
参考:
https://www.jianshu.com/p/931e9821c45a?utm_campaign=haruki
https://zhuanlan.zhihu.com/p/265691266
https://www.jianshu.com/p/ffdbedae80fa
网友评论