samtools faidx

作者: 小鱼儿_Y | 来源:发表于2021-02-03 17:24 被阅读0次

    samtools faidx 命令处理fasta序列

    samtools faidx 能够对fasta 序列建立一个后缀为.fai 的文件,根据这个.fai 文件和原始的fastsa文件, 能够快速的提取任意区域的序列

    用法:

    samtools faidx input.fa

    该命令对输入的fasta序列有一定要求:对于每条序列,除了最后一行外, 其他行的长度必须相同,

    one
    ATGCATGCATGCATGCATGCATGCATGCAT
    GCATGCATGCATGCATGCATGCATGCATGC
    ATGCAT
    two another chromosome
    ATGCATGCATGCAT
    GCATGCATGCATGC

    最后生成的.fai文件如下, 共5列,\t分隔;

    one 66 5 30 31
    two 28 98 14 15

    第一列 NAME : 序列的名称,只保留“>”后,第一个空白之前的内容;

    第二列 LENGTH: 序列的长度, 单位为bp;

    第三列 OFFSET : 第一个碱基的偏移量, 从0开始计数,换行符也统计进行;

    第四列 LINEBASES : 除了最后一行外, 其他代表序列的行的碱基数, 单位为bp;

    第五列 LINEWIDTH : 行宽, 除了最后一行外, 其他代表序列的行的长度, 包括换行符, 在windows系统中换行符为\r\n, 要在序列长度的基础上加2;

    提取序列:

    samtools faidx input.fa chr1 > chr1.fa

    samtools faidx input.fa chr1:100-200 > chr1.fa

    相关文章

      网友评论

        本文标题:samtools faidx

        本文链接:https://www.haomeiwen.com/subject/qnrmtltx.html