美文网首页小教程收藏blast和dot
TRF (Tandem Repeat Finder) 搜寻串联重

TRF (Tandem Repeat Finder) 搜寻串联重

作者: 胡童远 | 来源:发表于2020-06-24 19:56 被阅读0次

    官网:http://tandem.bu.edu/trf/trf.html

    一、安装

    • conda一键安装
    conda install trp
    trf -h
    

    二、TRF分析

    • 结果文件只能直接输出到当前文件夹,因此cd到新建的结果文件夹中运行
    mkdir Result/trf
    route=`pwd`
    cd Result/trf
    trf ../prokka/genome_prokka.fasta 2 7 7 80 10 50 500 -f -d -m 
    cd $route
    

    三、结果

    一共四个文件,一个个展示文件部分内容。

    • genome_prokka.fasta.2.7.7.80.10.50.500.1.html
    • genome_prokka.fasta.2.7.7.80.10.50.500.1.txt.html
    <pre>Found at i:42183 original size:10 final size:10
    [Alignment explanation](http://tandem.bu.edu/trf/trf.definitions.html#alignment)
        Indices: 42170--42195  Score: 52
        Period size: 10  Copynumber: 2.6  Consensus size: 10
          42160 TATAACACAT
          42170 AATAATACAA
              1 AATAATACAA
          42180 AATAATACAA
              1 AATAATACAA
          42190 AATAAT
              1 AATAAT
          42196 TCTATATGTA
    Statistics
    Matches: 16,  Mismatches: 0, Indels: 0
            1.00            0.00        0.00
    Matches are distributed among these distances:
      10   16  1.00
    ACGTcount: A:0.69, C:0.08, G:0.00, T:0.23
    Consensus pattern (10 bp):   
    AATAATACAA
    
    Left flanking sequence: Indices 41670 -- 42169
    ATATAGCAACTACTGTCTCTAATTGCTTTTCCTTATAGCTGTCTGACCATTCATCATGACGGAG
    
    Right flanking sequence: Indices 42196 -- 42695
    TCTATATGTATTGACTTTTAAAAATACTGCATGTATTATAAAAATATAAATCGTATTATTTATAA
    
    • genome_prokka.fasta.2.7.7.80.10.50.500.dat
    42170 42195 10 2.6 10 100 0 52 69 7 0 23 1.14 AATAATACAA AATAATACAAAATAATACAAAATAAT
    75340 75612 61 4.5 60 73 13 243 37 25 18 18 1.94 AGGATCACCCCCACATACATGGGGAACACTAAATAATCCTAGTGGAAATATTCCATAAAC AGGATCACCCCCACATACATGGGGAACACTAAATAATCCTAGTGGATAATATTCCTTAAACAGGATCACCCCCACATACATGGGGAACACTTAAAGGACGTGTTGGAGATACACAAGACTACAGGATCACCCCCACATACATGGGGAACACTAGCTGAAATTTTAGGGACTACACAAAAAGTAAGGATCACCCCCACATACATGGGGAACACTAAATAATCCTAGTGGATAATATTCCTTAAACAGGAGCACCCCCACATACATGGGGAACAC
    108121 108161 21 2.0 21 90 0 64 51 0 14 34 1.43 AATAATGGATAATGAGTTAAA AATAATGGATAATGAGTTAAAAATAATTGATAATGATTTAA
    199168 199204 18 2.1 18 94 0 65 27 16 24 32 1.96 AGCTTTCACTTAAGGATG AGCTTTCGCTTAAGGATGAGCTTTCACTTAAGGATGA
    199108 199264 78 2.0 77 87 4 226 27 18 21 33 1.96 AGCTTTCACTTAAGGATGAACTTGTACTCAAGGATTCACTCAACTGCTTGATGTACTTAAGCTTCCACTTAAGGATG AGCTTTCACTTAAGGATGAACTTGTACTCAAGGATTCACTTAATGAACTTGATGTGCTTAAGCTTTCGCTTAAGGATGAGCTTTCACTTAAGGATGAACTTGTGCTCAAGGATTCGCTCAAGCTGCTTGATGTACTTAAGCTTCCACTTAAGGATGA
    199306 199340 18 1.9 18 88 0 52 25 20 22 31 1.98 AGCTTTCACTCAAGGATG AGCTTTCGCTTAAGGATGAGCTTTCACTCAAGGAT
    199366 199400 18 1.9 18 88 0 52 25 20 22 31 1.98 AGCTTTCACTCAAGGATG AGCTTTCGCTTAAGGATGAGCTTTCACTCAAGGAT
    
    • genome_prokka.fasta.2.7.7.80.10.50.500.mask
    >1 [gcode=11] [organism=Genus species] [strain=strain]
    ATTACTTCTTCAGCAAAGTTTTCTTCTTTCTTTTCGATACCTTCGCCAACTTCATAACGA
    ACAAAAGATTTTACCTTACCATTCTTAGAAGCAACATATTTTGCAACTGTTAAATCAGGA
    TCCTTAACAAAGTCTTGATCATCCAATGCAACTTCTGCAAAGAACTTGTTCAAGCGACCA
    GCAACCATTTTTTCAATGATTTTTTCTGGCTTACCTTCATTCTTAGCTTCTTCTGTAAGA
    ACTTCCTTTTCATGTGCAACTTCAGCTTCTGGAACTTCATCACGGTTTACATACTTAGGA
    TTAATAGCAGCAACGTGCATAGCAACATCCTTAGCTGTAGCTTCATCAGCACCTTCTACT
    ACTGACAATACAGCAATACGTCCACCATCGTGTAAGTATGCACCAAAGTTGTCAGCGTCT
    

    相关文章

      网友评论

        本文标题:TRF (Tandem Repeat Finder) 搜寻串联重

        本文链接:https://www.haomeiwen.com/subject/lzcdfktx.html