美文网首页
RNAseq上游分析 | SRA文件下载完整性的检查

RNAseq上游分析 | SRA文件下载完整性的检查

作者: 苦哈哈的柠檬水 | 来源:发表于2022-03-03 16:12 被阅读0次

参考https://www.biostars.org/p/147148/

The sra-toolkit has a utility, vdb-validate which will report any errors in the data, and perform an md5 checksum comparison.

原始SRA数据

vdb-validate命令安装

conda install -c bioconda sra-tools

通过prefetch --option-file id下载的SRA数据,使用下方代码:

 for i in `ls *.sra`; 
 do 
 SRR=${i%%_*}; 
 echo $SRR >> list.txt; 
 done

 for j in `sort -u list.txt`
 do
 vdb-validate $j
 done

处理后fastq文件检查

通过fastq-dump --split-files --gzip命令处理后的fastq文件,使用下方代码:

for i in `ls *fastq.gz`; 
do 
gunzip -t $i 2 > $i.err
done
find . -name "*err" -type f -size +0c -exec -larth {} \;

相关文章

网友评论

      本文标题:RNAseq上游分析 | SRA文件下载完整性的检查

      本文链接:https://www.haomeiwen.com/subject/gxfurrtx.html