收集 | 序列提取工具

作者: 溪溪溪溪溪川 | 来源:发表于2019-04-09 10:39 被阅读33次

1.BED格式相关的提取

bedtools

bedops

2.提取序列相关

seqtik

seqtk

bam2fastq

3.windows提取

TBtools软件

4.perl脚本:get_fa_by_id.pl

用法:

perl get_fa_by_id.pl id pro.fa >id.fa  # id为geneid,pro.fa为库

script:

use strict;
die "perl $0<id><fa>“>输出目录”\n"unless @ARGV==2;
my($id,$fa)=@ARGV;
open IN,$id||die;
my%ha;
map{chomp;$ha{(split)[0]}=1}<IN>;
close IN;
$fa=~/gz$/?(open IN,"gzip -cd $fa|"||die):(open IN,$fa||die);  
$/=">";<IN>;$/="\n";  
my %out;  
while(<IN>){  
    my $info=$1 if(/^(\S+)/);  
    $/=">";  
    my $seq=<IN>;  
    $/="\n";  
    $seq=~s/>|\r|\*//g;  
print ">$info\n$seq" if(exists $ha{$info} && ! exists $out{$info});  
    $out{$info}=1;  
}  
close IN

更多详细用法请查看简书或者帮助文档!!!

相关文章

网友评论

    本文标题:收集 | 序列提取工具

    本文链接:https://www.haomeiwen.com/subject/wkxmiqtx.html