全基因组重测序是对已知基因组序列的物种进行不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析。
全基因组重测序的个体,通过序列比对,可以找到大量的单核苷酸多态性位点(SNP),插入缺失位点(InDel,Insertion/Deletion)、结构变异位点(SV,Structure Variation)位点和拷贝数变异位点(CNV,copy number variation)。SBC可以协助客户,通过生物信息手段,分析不同个体基因组间的结构差异, 同时完成注释。
生物信息分析内容
1.数据量产出
总碱基数量、Totally mapped reads、Uniquely mapped reads统计,测序深度分析。
2.一致性序列组装
与参考基因组序列(Reference genome sequence)的比对分析,利用贝叶斯统计模型检测出每个碱基位点的最大可能性基因型,并组装出该个体基因组的一致序列。
3.SNP检测及在基因组中的分布
提取全基因组中所有多态性位点,结合质量值、测序深度、重复性等因素作进一步的过滤筛选,最终得到可信度高的SNP数据集。并根据参考基因组序列对检测到的变异进行注释。
4.InDel检测及在基因组的分布
在进行mapping的过程中,进行容Gap的比对并检测可信的Short InDel。在检测过程中,Gap的长度为1~5个碱基。
5.Structure Variation检测及在基因组中的分布
目前SBC能够检测到的结构变异类型主要有:插入、缺失、复制、倒位、易位等。根据测序个体序列与参考基因组序列比对分析结果,检测全基因组水平的结构变异并对检测到的变异进进行注释。
网友评论