TRF--Tandem Repeat Finder

作者: 陈洪瑜 | 来源:发表于2019-04-22 13:52 被阅读31次

    TRF软件是基因组注释中常用于检测序列中串联重复序列的软件,无需安装,使用简单方便。

    1. 重复序列分为串联重复序列和散在重复序列(转座子);

    串联重复序列又包含卫星序列 >100bp;小卫星序列 10bp < <100bp;微卫星序列 <=10bp;软件有TRF,RepeatMasker

    转座子包含反转座子(复制粘贴)和DNA转座子(复制粘贴,剪切);反转座子又包含LTR 长末端重复序列;LINE 长散在元件;SINE 短散在元件;

    2. TRF安装

    trf下载地址:https://tandem.bu.edu/trf/trf409.linux64.download.html

    mv trf409.linux64 trf

    chmod a+x trf

    3. 软件运行

    命令格式:trf File Match Mismatch Delta PM PI Minscore MaxPeriod [options] (注:以上所有数字参数都为正数)

    File: 输入文件,fasta格式

    Match:匹配权重

    Mismatch:错配惩罚分值

    Delta:插入缺失惩罚分值

    PM:匹配概率

    PI:插入的概率

    Minscore:报告中比对的分值最小值,相当于筛选阈值

    MaxPeriod:重复片段长度的最大值

    options: -m 将重复序列屏蔽,即转为N表示;-f 表示输出重复序列两边各500bp碱基,主要用于PCR;-d 生成另外的总结文档,用于后续脚本分析等;-h 压缩html输出,默认会自动加上-d参数;

    一般设置参数为:trf sequence.fa 2 7 7 80 10 50 500 -m -f -d

    未加-h参数

    4. 结果文件

    除了会生成对应的masked文件,就是将重复序列用N表示,还会生成dat文件,展示重复序列的详细信息;masked文件可用于后续注释软件使用

    实际结果 表头说明

    此外还可参考http://www.chenlianfu.com/?p=1747

    参考网址:http://tandem.bu.edu/trf/trf.unix.help.html

    http://tandem.bu.edu/trf/trf.html

    http://www.chenlianfu.com/?p=1747

    http://tandem.bu.edu/trf/868y4Zg25ikZE.2.7.7.80.10.50.500.1.html

    http://tandem.bu.edu/trf/trf.definitions.html#table

    相关文章

      网友评论

        本文标题:TRF--Tandem Repeat Finder

        本文链接:https://www.haomeiwen.com/subject/mrqygqtx.html