美文网首页测序数据分析metagenomic
从fastq文件中抽取序列(Seqtk)

从fastq文件中抽取序列(Seqtk)

作者: nitrostarch | 来源:发表于2019-02-02 15:41 被阅读0次

    宏基因组的数据文件很大,难以用个人电脑完成分析,用Seqtk软抽取少量序列进行分析,以达到管中窥豹的目的

    安装

    cd /home/llt/software
    git clone https://github.com/lh3/seqtk.git
    cd seqtk
    make
    

    使用

    抽取1000万条序列。

    mkdir /home/llt/experiment/data/clean/subsamble_10m
    cd /home/llt/experiment/data/clean/subsamble_10m
    /home/llt/software/seqtk/seqtk sample -s 100 /mnt/d/BaiduYunDownload/MJ_cleandata/SS_G1.fastp.1.fq 10000000 > ssg1_10m.1.fq
    /home/llt/software/seqtk/seqtk sample -s 100 /mnt/d/BaiduYunDownload/MJ_cleandata/SS_G1.fastp.2.fq 10000000 > ssg1_10m.2.fq
    

    根据序列ID提取fasta序列

     seqtk subseq rep_set.fna  001name_list.txt > otu001.fasta
    

    相关文章

      网友评论

        本文标题:从fastq文件中抽取序列(Seqtk)

        本文链接:https://www.haomeiwen.com/subject/xmmssqtx.html