Day10-提取fasta文件中指定顺序的序列

作者: 腐草为嘤 | 来源:发表于2019-07-30 10:18 被阅读0次

Day10-提取fasta文件中指定顺序的序列
「数据整理」处理fasta文件的简单命令
利用python将gbk格式转换为fasta &&
linux学习
三. Fasta文件处理常用命令
从fasta文件中批量提取特定序列
awk处理FASTA格式文件
perl实战练习-计算fastq文件中每条序列的长度
Python脚本：fasta文件单序列信息提取
fasta文件根据ID提取序列

好久不见啦，办公室的工作有点繁忙鸭~今天遇到了一个挺简单的问题，但是用awk/sed/grep来解决好像有点难，就是提取fasta文件中第一条序列。因为很多fasta文件的序列部分都是自动换行的，所以我决定写一个简单的perl脚本来处理！
用法是：perl split_fasta.pl <dirname> <no>
其中dirname是fasta文件所在目录路径，便于批量处理；no是想要截取的第几条序列。
split_fasta.pl脚本内容如下：

use strict;
use warnings;

my $argnum;
my $dirname;
my $no;
my @files;

$argnum = @ARGV;
if($argnum != 2 ){
    die "usage: perl split_fasta.pl <dirname> <no>";
};
$dirname = $ARGV[0];
$no = $ARGV[1];
@files = glob("$ARGV[0]/*.fasta");
@ARGV = @files;

foreach my $i(@ARGV){
    my $a = 0;
    my $fasta = $i;
    open IN, "$fasta" or die "fail to open $fasta:$!\n";
    open OUT,">$fasta.seq$no.out" or die "fail to create $fasta.seq$no.out:$!\n";
    while (<IN>){
        chomp;
        if ($_ =~ /^>/){
            $a ++;
        }
        if ($a == $no){
            print OUT $_, "\n";
        }
    }
    close IN;
    close OUT;
}

原理很简单啦，算是给自己一个小小的perl练习！