从fastq文件中抽取序列(Seqtk)

作者: nitrostarch | 来源:发表于2019-02-02 15:41 被阅读0次

从fastq文件中抽取序列(Seqtk)
根据seqid提取fastq序列
Seqtk、Seqkit两个处理fa/fq神器的学习记录
一个随机抽取序列的perl脚本
算法（二）蓄水池抽样算法快速随机抽取reads
生信随手记2020-03-18：shell脚本展示fastp修剪
使用seqtk来分割混合的fastq序列
seqtk --- fasta/fastq文件的操作神器
fastq-dump从SRA文件中提取fastq文件
python提取fasta fastq文件信息

宏基因组的数据文件很大，难以用个人电脑完成分析，用Seqtk软抽取少量序列进行分析，以达到管中窥豹的目的

安装

cd /home/llt/software
git clone https://github.com/lh3/seqtk.git
cd seqtk
make

使用

抽取1000万条序列。

mkdir /home/llt/experiment/data/clean/subsamble_10m
cd /home/llt/experiment/data/clean/subsamble_10m
/home/llt/software/seqtk/seqtk sample -s 100 /mnt/d/BaiduYunDownload/MJ_cleandata/SS_G1.fastp.1.fq 10000000 > ssg1_10m.1.fq
/home/llt/software/seqtk/seqtk sample -s 100 /mnt/d/BaiduYunDownload/MJ_cleandata/SS_G1.fastp.2.fq 10000000 > ssg1_10m.2.fq

根据序列ID提取fasta序列

 seqtk subseq rep_set.fna  001name_list.txt > otu001.fasta

从fastq文件中抽取序列(Seqtk)
宏基因组的数据文件很大，难以用个人电脑完成分析，用Seqtk软抽取少量序列进行分析，以达到管中窥豹的目的安装使...
根据seqid提取fastq序列
工具：seqtk 从fasta/fastq文件中提取子集 seqtk subseq head40.fq a.lis...
Seqtk、Seqkit两个处理fa/fq神器的学习记录
Seqtk 安装 # Conda也可 1.将fastq 文件转换成fasta 文件 2.得到反向互补序列 3.s...
一个随机抽取序列的perl脚本
一个从 fasta 文件中随机抽取序列的脚本。
算法（二）蓄水池抽样算法快速随机抽取reads
原创：hxj7 关键词：蓄水池算法; fastq文件往往都很大，出于测试目的，我们经常要从fastq文件中随机抽取...
生信随手记2020-03-18：shell脚本展示fastp修剪
从修剪前后的fastq文件中各取100000行，将fastq格式文件每个序列的4行合并为1行，分别保存为raw.t...
使用seqtk来分割混合的fastq序列
前几天从SRA数据库下载的.sra数据在解压的时候没有使用 fastq-dump--split-files DRR...
seqtk --- fasta/fastq文件的操作神器
seqtk是李恒编写的一款能够快速处理fa/fq文件处理的神器，不仅能处理文本格式还能直接处理gzip压缩后的fa...
fastq-dump从SRA文件中提取fastq文件
fastq-dump是SRAtoolkit中使用频率很高的命令，用于从SRA文件中拆解提取fastq文件。具体用法...
python提取fasta fastq文件信息
1. Fastq 从fastq中提取出指定的序列，已知某一个read id，就可以提取fastq序列，如下为一个t...