美文网首页生信分析工具包
awk处理FASTA格式文件

awk处理FASTA格式文件

作者: Zhai1994 | 来源:发表于2019-10-23 18:49 被阅读0次

    从一个文件(input.fasta)提取第10至20个序列存到另一个文件(output.fasta)

    awk -v RS='>' 'NR>1{i++}i>=10&&i<=20{print ">"$0}' input.fasta | sed '/^$/d' > output.fasta
    

    将某一文件(input.fasta)中每一条序列保存到一个文件中

    # 输出文件名是1.fasta, 2.fasta, 3.fasta...
    awk '/^>/{f=++d".fasta"} {print > f}' input.fasta 
    # 输出文件名是序列ID
    awk '/^>/ {fout=sprintf("%s.fasta",substr($0,2));}{print >> fout;}' input.fasta
    

    根据IDs(id.txt)从fasta文件(input.fasta)中提取序列

    awk -F'>' 'NR==FNR{ids[$0]; next} NF>1{f=($2 in ids)} f' id.txt seq.fasta
    

    相关文章

      网友评论

        本文标题:awk处理FASTA格式文件

        本文链接:https://www.haomeiwen.com/subject/izjructx.html