SRAtoolkits: fastq-dump

作者: LET149 | 来源:发表于2023-05-08 09:25 被阅读0次

    将下载的SRA文件转换成fastq或者fasta文件

    1. 普通双端拆分

    fastq-dump --split-files filename.sra

    将SRA文件转换成R1和R2两个fastq文件,R1是Barcode+UMI,R2是RNA序列

    2. 普通单端拆分

    fastq-dump --split-3 filename.sra

    3. 以.gz格式保存fastq文件

    fastq-dump --gzip --split-files

    4. 报错及解决

    4.1 报错一

    Rejected 20042 READS because READLEN < 1
    .sra文件中其中有些read的长度为0,而在拆分.sra文件时会有一个-M的参数设置,这个参数规定了read的最少length,默认参数为1;在-M为默认参数下,length0read会被去除,单端测序在这种情况下只会减少一些数据量,其他没有影响;双端测序在这种情况下由于两端测序数据中length0read不一样,从而导致双端测序read不能对齐,导致下游数据分析失败

      1. 解决方案:添加 -M 0参数
      1. 解决效果:长度为0的行被保存,@开头和+开头行与其他read相同,序列行测序质量行依然存在,不过没有任何值

    相关文章

      网友评论

        本文标题:SRAtoolkits: fastq-dump

        本文链接:https://www.haomeiwen.com/subject/fuqafktx.html