使用本地nt数据库对reads和Trinity结果进行blast

作者: 周小钊 | 来源:发表于2020-09-05 15:42 被阅读0次

使用本地nt数据库对reads和Trinity结果进行blast
比对率不理想-污染检测
【生信知识】---Blast2.10+的安装及NT核酸数据库本地
基因组注释之从头预测
BLAST数据库构建过程中sseqid无法关联到staxids的
转录组分析实战第七节：采用Trinotate对拼接结果进行注释
blast本地比对输出结果
blast本地比对输出结果
NCBI远程批量blast获取物种信息
使用TBtools进行本地blast并根据blast结果提取相关

上个笔记中，进行了共生物种的确定，由于地下部位的转录组还有一部分reads没有比对上，可能是样品污染问题，也可能含有其他的物种，所以，想使用Trinity和为比对上的reads去比对到nt数据库查看结果

nt数据库下载和构建

wget https://ftp.ncbi.nih.gov/blast/db/FASTA/nt.gz 
wget https://ftp.ncbi.nih.gov/blast/db/FASTA/nr.gz.md5
md5sum nt.gz
gunzip nt.gz
nohup makeblastdb -in nt -parse_seqids -hash_index -dbtype nucl -logfile nt_logfile &

这样，nt数据库就构建好了，后续的话利用这个数据库去确定物种

下载数据库和构建时间有点长，需要耐心等待

使用未比对的reads进行blast

在运行STAR时，加入--outReadsUnmapped Fastx参数会将未比对的reads输出到文件，双端测序会生成mate1和mate2两个文件，利用该reads去blast

$cat S1-1Ufli.left.fa S1-1Ufli.right.fa>S1-1.reads.fa
$cat S3-1fli.left.fa S3-1fli.right.fa>S3-1.reads.fa

$nohup blastn -query S1-1.reads.fa -out S1-1.reads.blast -db /datadisk02/data/nt -outfmt 6 -evalue 1e-10 -num_threads 8 -qcov_hsp_perc 50.0 -num_alignments 5 2> blastn1-1.log &

$nohup blastn -query S3-1.reads.fa -out S3-1.reads.blast -db /datadisk02/data/nt -outfmt 6 -evalue 1e-10 -num_threads 8 -qcov_hsp_perc 50.0 -num_alignments 5 2> blastn3-1.log &

使用Trinity组装未比对的reads后进行blast

在把未比对的reads进行blast之后，我又试着把未比对的reads用Trinity进行组装，并进行blast

$nohup Trinity --seqType fa --max_memory 50G --left S1-1Ufli.left.fa  --right S1-1Ufli.right.fa --CPU 16 --output S1-1Ufli_trinity &

$nohup Trinity --seqType fa --max_memory 50G --left S3-1fli.left.fa  --right S3-1fli.right.fa --CPU 16 --output S3-1fli_trinity &

$nohup blastn -query S1-1Ufli_trinity/Trinity.fasta -out S1-1.trinity.blast -db /datadisk02/data/nt -outfmt 6 -evalue 1e-10 -num_threads 8 -qcov_hsp_perc 50.0 -num_alignments 5 2> blastn1-1t.log &

$nohup blastn -query S3-1fli_trinity/Trinity.fasta -out S3-1.trinity.blast -db /datadisk02/data/nt -outfmt 6 -evalue 1e-10 -num_threads 8 -qcov_hsp_perc 50.0 -num_alignments 5 2> blastn3-1t.log &