四种碱基的判读-Hiseq测序原理2

作者: 6102 | 来源:发表于2018-12-16 15:03 被阅读1次

本文回答以下两个问题:
1. 根据扫描得到的光点图,如何判断一个位置上的碱基是什么
2. 评估1中判断的可靠性

插图全部来自【陈巍学基因】视频2:HiSeq工作原理,本文是对该视频的学习笔记

1. 四种碱基的判读规则

  • C > 0.6 即 Ia/Ib > 1.5,该位置的碱基是“好碱基”
  • Ia :光点中占比最高的荧光素含量
  • Ib :光点中占比第二的荧光素含量
  • Pass Filter:前25个碱基中,坏碱基的个数小于等于1,则该read的Pass Filter=pass,否则不pass
  • 对data进行Pass Filter的目的:去掉多克隆cluster
  • 多克隆cluster中光点上,占比最高的荧光素含量与占比第二的荧光素含量相近,判读误差大,无法确定到底是哪种碱基
  • PF rate = Pass Filter的reads数目/总的测到的reads数目
  • 上样密度过高,PF rate 会下降(多克隆cluster会增多)

2. 评估碱基判读

Quality Score
  • 评价一个位置上碱基判读可靠性的指标,评价碱基误判的可能性


  • Q30比例 = 达到或超过Q30的数据 / 总的Pass Filter的数据



linux环境下FASTQ文件预览

相关文章

网友评论

    本文标题:四种碱基的判读-Hiseq测序原理2

    本文链接:https://www.haomeiwen.com/subject/kbxxkqtx.html