不谈测序就讲入门生信就是耍流氓。
尽管你可能会说生信分析还包括组学分析,蛋白质分析,但小D认为生信的基础离不开测序技术,所以啊,小D公众号的第一讲就想给大家再梳理一遍测序技术的常识。
测序技术迭代迅猛,在短短30年时间里已发展了3代半,第一代测序技术始于1977年Sanger测序,其基本原理是利用ddNTP的3‘端脱氧而阻断DNA合成的原理开展,也是靠它完成了2001年的首个人类基因组图谱。 ddNTP 是在3’C 上缺了羟基的dNTP,测序过程中以A通道为例,该通道会含有dATP ,以及缺羟基的ddATP ,在反应过程中,模板上每个A碱基的位置都有几率合成一个ddATP,因此而中断反应。 整个反应结束后,A通道里有不同长度的片段,它们都是被终止在了A碱基的位置, 其他通道亦然。后续,通过跑胶,得到每个通道片段长度,从而确定每一碱基位点该call 哪个碱基。
(nationaldiagnostics.com)
二代测序区别于一代测序最主要的点在于它的高通量,和成本低,片段小。 测序过程通常包括,DNA或者RNA的准备,DNA片段化(通过超声,酶切等方法), DNA 小片段扩增建库,主要是通过PCR。接着就是测序,SBS(sequncing by synethsis),二代主打的边测序边反应技术是不同于一代测序的终止反应。二代测序的主要代表技术是Roche 454(已过时), Illumina(大佬)的桥扩增,SOLiD(‘油包水’PCR扩增),华大基因买断美国CG公司的纳米球测序(球状DNA含有PCR复制的短序列),还有就是Ion Torrent(通过检测每个碱基合成时产生的电流来call碱基)。下图展示的是illumina 桥扩增技术。
(bioinformaticsgroup.com)
到了第三代测序,又叫单分子测序,为了节约成本,开始了又一轮的的改进,例如,去掉PCR扩增,增长reads的读长,三代测序中代表有,PacBio, Helicos, Nanopore, 三代测序旨在实现DNA聚合酶的延续性,使得在一个反应内有上千个碱基得到合成。 下图(a)是PacBio的原理,DNA聚合酶和模板被固定,流体中是含有不同dye的碱基,通过合成时激发的荧光判定碱基。 图(b)则是nanopore 的展示,其技术的核心是一个通道只有单分子通过,通过时的电流变化被捕捉, 通过电流的变化来call碱基。
三代虽好,但它的精确度还是有待提高。相比上一代,二代测序,其错误率是最高的,但确也是最有挖掘前景的。
(sciencedirect.com)
回顾完了测序技术的发展,再来聊聊技术的更新换代对于行业内的影响。 从2003 年30亿美元的人类全基因组测序之后,随之而来的Illumina, PicBio, Ion Torrent,等NGS技术使得测序成本十年之内大幅降低, 人类全基因组测序已从当年的30亿美金降至600美元,其速度已远超摩尔定律。那有小伙伴想问了现在是测序成本的平台期了呢? 小D 的看法是, 二代测序从技术或成本很难再有质的突破了, 但很难预测三代,甚至四代测序会带来怎样的红海。越来越多的基因公司出现于人前,可见健康产业已为大众熟知。产前检测,癌症筛查,遗传病预防等,我们希望倾听我们的基因说什么...
基因行业的发展将带来的是大量数据,这才是一个新的有待挖掘的领域,如何更快更好的从数据中发现隐藏信息,考验着每个生信人。做生信可不仅仅是跑流程, 搭建流程,挖掘数据才是每个生信人所应具备的基本素质。
网友评论