问题
Per base sequence content :理论上,ATCG碱基的分布应该差别不大,即四条线应该大致平行状态,但数据reads左端15bp仍然存在AT或CG差异超过10%,检测报告危险。



原因
测序机器前几个碱基测序时候因为状态调整导致测序略有偏差,如果前几个碱基偏差较大,可以在后期将前几个碱基切掉。造成这个偏差较大的原因重要是由于测序数据中的adapter没有clean干净。
解决
切掉reads左端15bp,使用软件是 NGSQCToolki的Trimming/TrimmingReads.pl
,命令如下:
nohup perl /path/NGSQCToolkit/Trimming/TrimmingReads.pl -i Sample_gen_20160524_GTGAAA_L001_R1.fastq -l 15 -n 25 &
软件:====== NGS QC Toolkit ======
用于下一代测序(NGS)数据的质量控制(QC)的工具包。 该工具包包括用户友好的独立工具,用于使用Illumina和Roche 454平台生成的序列数据的质量控制,并以表格和图形的详细结果,以及过滤高质量序列数据。 它还包括少量其他工具,有助于NGS数据质量控制和分析。
wget http://59.163.192.90:8080/ngsqctoolkit/cgi-bin/download.pl?toolkit=NGSQCToolkit_v2.3.3.zip
unzip NGSQCToolkit_v2.3.3.zip
sudo mkdir /export/apps/ngsqctoolkit
sudo cp -r NGSQCToolkit_v2.3.3 /export/apps/ngsqctoolkit/2.3.3
sudo chmod +x /export/apps/ngsqctoolkit/2.3.3/Format-converter/*.pl
sudo chmod +x /export/apps/ngsqctoolkit/2.3.3/QC/*.pl
sudo chmod +x /export/apps/ngsqctoolkit/2.3.3/Statistics/*.pl
sudo chmod +x /export/apps/ngsqctoolkit/2.3.3/Trimming/*.pl
网友评论