1 外显子和外显子组
外显子是蛋白质的编码区域,是这和生物基因组的一部分。基因组中的全部外显子称为外显子组。人类基因组大约有1.8*10^5个外显子,30Mb,占人类基因组的1%。
研究表明,人类85%以上的疾病基因都由外显子碱基突变造成。
exom
2外显子测序技术的原理
Exome sequencing, 也叫 whole exome sequencing (WES)
流程包括三步:
- 外显子序列的捕获富集
- DNA测序
- 数据统计分析
2.1 外显子组的捕获富集
目前,主要通过(NimbleGen)和安捷伦(Agilent) 两种捕获芯片对外显子序列进行富集。其基本原理是捕获,富集,高通量分析
- 首先将基因组 DNA随机打断成200 ~ 300 bP 左右的片段,随后进行 DNA片段平末端修复,5'端加磷酸基团,3'端 加 PolyA 尾 ,通过 TA连接将接头序列加到片段两端,经过一轮 PCR增后成为完整的片段文库
- 然后将这些DNA片段与捕获芯片进行杂交,从而得到富集的目标片段;随机把目的片段连接成长链DNA片段
- 然后再次随机打 断并在其两端连接上测序接头
- 然后用与接头相匹配的序列为引物进行PCR扩增
- 经质量检测合格后的外显子组文库即可上机测序。
2.2 DNA测序
二代测序为主
2.3 数据分析
- 常规图像信息数据分析
去噪音,锐化,定位,校正等
- 生物信息学分析
挖掘变异位点(包括SNP,短的插入/缺失片段)
流程是:通过质控去除测序中的低质量reads,然后将高质量的reads与参考基因组进行比对,统计SNP,Indels,CNV等,并进行注释,筛选,分析,验证等。
SNP
3 应用
3.1 遗传性疾病的检测
遗传性疾病包括单基因并,多基因病,染色体异常疾病,线粒体基因病和体细胞遗传病等。
单基因疾病又叫孟德尔遗传病,是单个基因突变导致的疾病,常以孟德尔遗传模式存在于家系。
3.2 发现致癌基因和抑癌基因
外显子区域突变容易导致非正常功能蛋白的产生,甚至和细胞癌变能力相关。这对标记物,治疗等有重要意义。
网友评论