美文网首页生命科学-简书专题
知道高通量测序也应该知道这些

知道高通量测序也应该知道这些

作者: Ternq8 | 来源:发表于2018-06-12 13:21 被阅读6次

    1. 什么是reads

    高通量测序平台产生的序列成为reads

    2. 什么是contig

    拼接软件基于reads之间的overlap区,拼接获得的序列称为contig(重叠群)。

    3. 什么是scaffold

    基因de novo测序,通过reads拼接获得contigs后,通常还要构建454 paired-end库或者Illumina Mate-pair库,以获得一定大小片段(如3kb,6kb,10kb,20kb)双端序列。基于这些序列,可以确定一些contig直接的顺序关系,这些先后顺序已知的contigs组成scaffold。

    4. 什么是Contig N50

    Reads拼接后会获得一些不同长度的Contigs。将所有的Contig长度相加,能获得一个Contig总长度。然后将所有的Contigs按照从长到短进行排序,如获得Contig 1,Contig 2,Contig 3...………Contig 25。将Contig按照这个顺序依次相加,当相加的长度达到Contig总长度的一半时,最后一个加上的Contig长度即为Contig N50。举例:Contig 1+Contig 2+ Contig 3 +Contig 4=Contig总长度*1/2时,Contig 4的长度即为Contig N50。Contig N50可以作为基因组拼接的结果好坏的一个判断标准。

    5. 什么是Scaffold N50

    Scaffold N50与Contig N50的定义类似。Contigs拼接组装获得一些不同长度的Scaffolds。将所有的Scaffold长度相加,能获得一个Scaffold总长度。然后将所有的Scaffolds按照从长到短进行排序,如获得Scaffold 1,Scaffold 2,Scaffold 3...………Scaffold 25。将Scaffold按照这个顺序依次相加,当相加的长度达到Scaffold总长度的一半时,最后一个加上的Scaffold长度即为Scaffold N50。举例:Scaffold 1+Scaffold 2+ Scaffold 3 +Scaffold 4 +Scaffold 5=Scaffold总长度*1/2时,Scaffold 5的长度即为Scaffold N50。Scaffold N50可以作为基因组拼接的结果好坏的一个判断标准。

    参考:
    http://kaopubear.top/2017-09-24-ArtifactsandInsert.html

    相关文章

      网友评论

        本文标题:知道高通量测序也应该知道这些

        本文链接:https://www.haomeiwen.com/subject/ckbleftx.html