TRF (tandem repeats finder)可用于鉴定基因组中的tamdem,及串联重复
1、下载
点击此处 进入下载即可,下载后可直接使用。
![](https://img.haomeiwen.com/i19633912/6e0ef9e04b2707aa.png)
2、参数说明
- file: 输入fasta序列;
- Match: 匹配上的权重
- Mismatch: 没有匹配上的权重
- Delta:插入缺失罚分
匹配权重值为2时,对未匹配上和插入罚分在3-7范围内时有效的,当mismatch和indel权重为负数时,程序中断。3者推介值依次为2,7,7 - PM: 匹配概率,整数(最佳80)
- PI: 插入缺失概率 整数 (最佳 10)
- Minscore:匹配上的串联重复序列最小分值,如果设定匹配权重为2,最小分值为50,最佳匹配需要匹配至少25bp
- MaxPeriod:最大的重复单元bp数,程序将会找到重复单元在1-2000的所有重复,但是可以限制更小的范围
可选参数: - m: 屏蔽序列文件,在每一个串联重复序列出现的地方(每一个核苷酸)都替换成N显示
- f: 标记串联重复序列两侧的侧翼序列,包含500个核苷酸。输出文件扩展名为txt
-d: 输出文件
-h: 禁止输出html
3、小试牛刀
选用一测试序列 test.fa
trf409.linux64 test.fa 2 7 7 80 10 50 2000 -d -h
得到结尾为.dat 的文件,其中每一列对应如下:
![](https://img.haomeiwen.com/i19633912/778a62a495497429.png)
网友评论