名词解释
flowcell (流动池)
flwocell是带有流通槽的玻璃滑块,是测序反应的载体,里面有8条lane。
lane(流通槽)
lane是测序反应的平行泳道,是试剂添加、洗脱等过程的发生位置。
tile
每一个lane里最小的单位叫做一个tile,每个tile会种下不同的cluster,每个tile在一次循环中会拍照4次(每个碱基一次)。
reads
测序的结果就叫做一个reads,对双端测序来说,5'端reads叫reads1,3'端reads叫reads2。
flowcellillumina测序的工作流程
https://www.bilibili.com/video/av13107081
一.sample prep(样本准备)
样品准备就是在DNA fragments(片段)的末端添加adaptors(接头)。超声波将DNA分子打断成300-800bp长序列片段(人类基因组打成300-500bp),用酶补平为平末端,然后3‘端加一个A碱基(因为接头的3‘端有一个突出的T),再在两端加上互补配对的adapter,再通过PCR扩增达到一定浓度,构成单链DNA文库。
adaptor修饰
二.cluster generation(簇形成)
每一个lane固定了两种不同的oligos(寡聚核苷酸引物)(垂直于lane),测序时,两种oligos中的一种和fragment上的adaptor互补结合,如下图所示:
互补过程
再之后双链分子变性,原始模板(左)被洗去,右边链通过bridge PCR进行扩增。随后不断扩增,生成数百万个cluster,如下图:
cluster
之后所有的reverse strands(反向链)被切断洗去,只留下forward strands(正向链)。正向链的3'端会封锁,防止特异性结合。
三.sequencing(测序)
测序从第一个测序引物primer的延伸开始,生成第一个read(读段)。每一个核苷酸都带有荧光标记。四种核苷酸带有四个不同的荧光标记,发射出特征性的荧光信号,这个专有过程叫sequencing-by-synthesis.循环结束后,生成的read product被冲掉,在生成下一个read。整个过程生成数百万个reads,代表所有的fragment。
https://www.bilibili.com/video/av9273946
这个视频的21分有讲双端测序的过程,自己写的过程里没提到第二条链怎么生成的。
四.data analysis(数据分析)
fastq格式测序后生成的文件为fastq格式,每4行为一个read,read第1行:空格左边(从红色的1开始)为ID信息,DJG8....为测序仪信息,后边数字代表是测序仪运行的第272次。空格右边为barcode信息,用于区分样品。第2行为测序结果序列信息。第4行为碱基质量值。
网友评论