FASTQ格式说明

作者: jlyq617 | 来源:发表于2018-06-06 15:45 被阅读306次

    illumina下fastq文件命名

    FASTQ文件在Illumina下通常会被命名为
    SampleName_S1_L001_R1_001.fastq.gz
    比如 NTC_S11_L001_R1_001.fastq.gz
    其被下划线_分为了五个部分:
    第一部分:SampleName,样本名,与上机时在Sample Sheet中填写的一致
    第二部分:S1,S***,S后跟的数字与样本在Sample Sheet中的顺序一致,从1开始。不能分配到确定样本的read会归到S0(Undetermined_S0)
    第三部分:L00*,泳道lane的编号
    第四部分:R*,R1表示read1,R2表示read2。R1和R2为paired end reads。同一个样本的配对的FASTQ,只有这个地方不同
    第五部分:001,通常为001

    fastq格式

    Each entry in a FASTQ file consists of four lines:
    • Sequence identifier
    • Sequence
    • Quality score identifier line (consisting of a +)
    • Quality score

    Fastq

    Sequence identifier
    @<instrument>:<run number>:<flowcell ID>:<lane>:<tile>:<x-pos>:<y-pos><read>:<is filtered>:<control number>:<index sequence>
    eg:

    Quality score
    The character '!' represents the lowest quality while '~' is the highest. Here are the quality value characters in left-to-right increasing order of quality (ASCII):

    Quality score

    相关文章

      网友评论

        本文标题:FASTQ格式说明

        本文链接:https://www.haomeiwen.com/subject/fnbbsftx.html