美文网首页NGS分析流程WGS实战篇
WGS实战笔记(三)----质量和碱基数bug及samtools

WGS实战笔记(三)----质量和碱基数bug及samtools

作者: liu_ll | 来源:发表于2018-11-22 21:15 被阅读11次

    先提上昨天跑的程序的报错信息:这个是跑了一半之后,报错然后退出了


    picard的报错信息

    根据报错信息的提示:说是我的碱基信息和质量信息不相符,我看了一下碱基信息150bp,质量信息140个。但是这是SAM文件里的信息,所以还是得回溯到fq文件中看看原始的情况

    zcat ./BCA0106_R2.fq.gz | grep "E00492:317:HLG2MCCXY:3:1201:26869:33973" -C 4 >shuchuR2.txt
    

    可以利用zcat这个linux命令查看gz文件的内容,然后带上grep函数,-c是可以看前后4行,输出到输出的一个txt文件夹中。

    我分别在质控前和质控后的文件都用zcat命令看了,进行比较。
    1:用zcat跑完的结果


    质控前R2 的reads的信息 质控前R1 的reads信息

    这个都说明公司测序的数据没有问题
    问题解决方案:我还是回溯到最原始的方法,先samtools 然后输出到bam文件,再对bam文件进行排序(其实有优化代码)

    bwa mem -t 8 -M -Y -R "@RG\tID:L1\tSM:BCA0106-2\tLB:WGS\tPL:Illumina" /asnas/sunyl_group/liull/Database/hg38/chroms-index/hg38.fa  /asnas/sunyl_group/liull/twins_WGS/BCA0106/1_qc/output_BCA0106_Rnas2_paired.fq.gz  /asnas/sunyl_group/liull/twins_WGS/BCA0106/1_qc/output_BCA0106_R1_paired.fq.gz | samtools view -Sb - > ./BCA0106.bam
    samtools sort -@ 8 -m 10G -O bam -o /asnas/sunyl_group/liull/twins_WGS/BCA0106/2_BWA/BCA0106.paired.sort.bam  /asnas/sunyl_group/liull/twins_WGS/BCA0106/2_BWA/BCA0106.bam   
    

    先是用samtools先把bam文件生成,利用了管道符,避免了中间的sam文件的生成
    。前面这个命令跑的时间很久,大概16个小时。
    如果内存足够大的话,推荐下面的优化代码

    bwa mem -t 8 -M -Y -R "@RG\tID:L1\tSM:BCA0106-2\tLB:WGS\tPL:Illumina" /asnas/sunyl_group/liull/Database/hg38/chroms-index/hg38.fa  /asnas/sunyl_group/liull/twins_WGS/BCA0106/1_qc/output_BCA0106_Rnas2_paired.fq.gz  /asnas/sunyl_group/liull/twins_WGS/BCA0106/1_qc/output_BCA0106_R1_paired.fq.gz | samtools sort  -@ 8 -m 10G -O bam 
     - > /asnas/sunyl_group/liull/twins_WGS/BCA0106/2_BWA/BCA0106.paired.sort.bam  
    

    无奈要求内存和线程,带不起来会报错。百度了一遍不是很懂文件的信息,求大神翻牌求教


    .e文件信息

    相关文章

      网友评论

        本文标题:WGS实战笔记(三)----质量和碱基数bug及samtools

        本文链接:https://www.haomeiwen.com/subject/irqtqqtx.html