工作之后就不局限于微生物组学分析了哈哈哈。
接下来我要学的流程包括:
外显子组测序(Whole Exome Sequencing,WES)、全基因组测序(Whole Genome Sequencing,WGS)、全基因组甲基化测序(Whole Genome Bisulfite Sequencing,WGBS)、单细胞测序(Single Cell Sequencing,SNS)、微生物单细胞基因组测序(Microbe-seq)、宏基因组测序(metagenomic sequencing)、转录组测序(RNA-seq)、扩增子测序(Amplicon Sequencing)、单管长片段测序(single tube Long Fragment Read,stLFR)、时空组学(Stereo-seq)。[其他待补充...]
以下对这些测序进行简单的介绍:
1. WES and WGS:
a. WES
WES 是指利用序列捕获技术将外显子区域DNA捕获富集后进行高通量测序,能够直接发现与蛋白质功能变异相关的遗传变异SNP(单核苷酸多态性)。因此外显子组测序广泛用于识别和研究与疾病、种群进化相关的编码区及UTR区域(外显子中不翻译的部分)内的变异。结合大量的公共数据库,有利于更好地解释所得变异与疾病的关系。
b. WGS
且随着近年来测序技术不断进步、成本不断降低,使得全基因组测序变得触手可及。WGS是对生物体整个基因组序列进行测序,可以获得完整的基因组信息。WGRS (whole genome re-sequencing,全基因组重测序)是指将测序得到的DNA测序片段与已知参考基因组进行比对,找到大量的单核苷酸多态性位点(SNP)、插入缺失位点(InDel,Insertion/Deletion)、结构变异位点(SV,Structure Variation)和拷贝数变异位点(CNV,copy number variation)。从而得到其中的变异信息。WGS的最大特点是包含了非编码区的序列信息。而目前基于WGS技术的疾病研究显示,非编码区的DNA变异与复杂疾病发生有很大关联。
c. SNP
单核苷酸多态性(single nucleotide polymorphism,SNP)主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一种,占所有已知多态性的90%以上。SNP在人类基因组中广泛存在,平均每500~1000个碱基对中就有1个。 SNP所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基的转换或颠换所引起,也可由碱基的插入或缺失所致。但通常所说的SNP并不包括后两种情况。在基因组DNA中,任何碱基均有可能发生变异,因此SNP既有可能在基因序列内,也有可能在基因以外的非编码序列上。总的来说,位于编码区内的SNP(cSNP)比较少,其变异率仅及周围序列的1/5。但它在遗传性疾病研究中却具有重要意义,因此cSNP的研究更受关注。
从对生物的遗传性状的影响上来看,cSNP又可分为2种:一种是同义cSNP,即SNP所致的编码序列的改变并不影响其所翻译的蛋白质的氨基酸序列;另一种是非同义cSNP,指碱基序列的改变可使以其为蓝本翻译的蛋白质序列发生改变,从而影响了蛋白质的功能。这种改变常是导致生物性状改变的直接原因。cSNP中约有一半为非同义cSNP。
c、WES与WGS如何选择?
如果在基于对疾病病理知识研究不深入情况,比较关注非编码变异和结构变异的研究,WGS是首选的技术。一般测序深度在30X以上,相应的测序数据量在90G以上。WGS的不足在于数据量大,成本高,数据解读难度大,此外测序深度较低,不利于低丰度变异的检测。而外显子测序则可以弥补全基因组重测序高成本、低深度的不足,有效的检测低丰度变异。相比较全基因组测序,外显子测序更高深度,更加经济、高效。WES能直接对蛋白编码序列进行测序,找出影响蛋白结构的变异;高深度测序,可发现常见变异、低频变异及罕见变异;针对外显子组区域测序,WES有效降低费用、周期和工作量。但由于WES有捕获过程带入的偏好性,及对非编码区覆盖较少,因此对于CNV/SV的检出准确度不高。
2. WGBS
DNA甲基化是重要的表观遗传学标记信息,获得全基因组范围内所有C位点的甲基化水平数据,对表观遗传学的时空特异性研究具有重要意义。WGBS便是采用亚硫酸氢盐处理基因组DNA使未甲基化修饰的胞嘧啶C转化为尿嘧啶U,通过对处理后的DNA进行全基因组重测序,并与参考基因组进行比对,从基因组水平实现单碱基分辨率的、高精确度甲基化水平分析。
WGBS的优势
1.测精度高:单碱基分辨率,精确分析每一个C碱基的甲基化状态;
2.检测范围广:借助高通量测序平台,对全基因组范围内甲基化区域进Chemicalbook行研究;
3.可靠性高:直接对甲基化片段进行测序和定量,无交叉反应和背景噪音;
4.性价比高:相比PCR+Sanger测序方法,使用抗体富集高甲基化区域测序,费用少。
目前WGBS广泛应用于细胞分化、组织发育等基础机制研究,以及动植物育种、人类健康与疾病治疗等研究领域。
3. SNS
普通测序所提取的RNA(或DNA)源于样本中的多个细胞,所以普通测序的结果会受到不同细胞间异质性(Heterogeneity)的影响。而通过单细胞测序技术,可以进行单个细胞的捕获、裂解、DNA/mRNA 富集建库和 NGS 测序等流程,实现了单细胞水平的基因组/转录组测序。从而更好地帮助我们认识细胞与细胞之间的差异。
一开始进行单细胞测序,是将单个细胞分离出来,独立构建测序文库的方法来进行,如有限稀释法、显微操作法、激光显微切割、流式细胞术等。受细胞分离技术和高昂成本所限,这些单细胞测序技术只能检测少量的细胞(几十到几百个)。但随着测序技术的深入研究,出现了基于barcode标签的单细胞识别,伴随着Drop-Seq、Cyto-Seq等基于微滴或微孔的新型单细胞分离技术的出现,使得单个细胞分离和捕获测序的成本大大降低,单细胞转录组测序进入了高通量时代。在单细胞转录组测序技术快速发展的同时,单细胞多组学技术也在迅猛发展。如单细胞转录组与单细胞ATAC(染色质可及性检测)联合检测等。目前,单细胞多组学检测已包含转录组、基因组、表观组、免疫组、蛋白组等多个组学方面,为单细胞水平上的研究提供了更全面、更精细、更完整的分析策略。
4. Microbe-seq
如今,哈佛大学和麻省理工学院的研究团队开发了一种微生物高通量单细胞基因组测序技术(Microbe-seq),技术集成了多种液滴微流控操作技术和定制开发的生物信息学分析手段,不需要培养即可从复杂微生物群落中获取成千上万个单细胞微生物的基因组信息,并组装出高质量的菌株水平基因组,从而能够在不损失分辨率或广泛物种适用性的基础上探究微生物群落的基因组。该方法应用面广泛,可用于具有复杂微生物群落的样本,如粪便、土壤和海洋等。
5. stLFR
长读长技术主要有两类:一是单分子实时测序技术,主要有两家公司: Pacific BioScience和Oxford Nanopore(三代测序);二是标记大片段,通过短读长数据(二代测序)拼接形成大片段,CG公司早在2012年就发表了这个技术(LFR),但后续推出商业化试剂盒的是lllumina和10X Genomics,后续华大研发了无分隔长片段读取技术(stLFR技术),实现了基于高精度短读测序获取长片段DNA信息。
stLFR大致流程是:从提取好的长片段DNA起始,将转座子序列随机插入至长片段DNA中,利用DNA双链互补原理将该产物与带有多拷贝分子标签的磁珠载体结合,在引入第二个接头后进行PCR扩增,最终完成文库构建。
6. RNA-seq
转录组是特定组织或细胞在某一发育阶段或功能状态下转录出来的所有RNA的总和,主要包括mRNA和非编码RNA(non-coding RNA,ncRNA)。转录组研究能够从整体水平研究基因功能以及基因结构,揭示特定的生物学过程,已广应用于植物候选基因发掘、功能鉴定及遗传改良等领域。随着新一代测序平台的市场化,RNA-Seq技术已成为了转录组学研究的重要手段之一。该技术利用高通量测序平台对基因组cDNA测序,通过统计相关Reads数计算出不同mRNA的表达量,分析转录本的结构和表达水平,同时发现未知转录本和稀有转录本,精确地识别可变剪切位点以及编码序列单核苷酸多态性,提供最全面的转录组信息。转录组测序技术流程主要包括样品制备、文库构建、DNA成簇扩增、高通量测序和数据分析,相对于传统的芯片杂交平台,RNA-Seq技术具有诸多独特优势,转录组测序无需预先针对已知序列设计探针,即可对任意物种的整体转录活动进行检测,提供更精确的数字化信号、更高的检测通量以及更广泛的检测范围,是目前深入研究转录组的强大工具。
7. Metagenomic and Amplicon Sequencing
这个就不过多写了哈哈哈。简单来说,宏基因组是对环境中所有微生物的基因组进行的非靶向测序,这里提一下,宏基因组分箱技术(Binning)通过四核苷酸频率(TNF)和序列的丰度从宏基因组数据中分离出优势微生物的基因组草图(获得与Microbe-seq类似的效果)是宏基因组学深入研究的可行方法;扩增子测序是对环境中的目的基因进行靶向测序,例如16s测序是对环境中所有16s基因的某段高变区进行的靶向测序。
8. Stereo-seq
Stereo-seq由华大自主研发,基于DNA纳米球(DNA Nano Ball,DNB)开发,是具有高通量、超高分辨率、大视场的原位全景式技术,可以实现同一样本在组织、细胞、亚细胞、分子“四尺度”同时进行空间转录组分析。该技术是通过时空芯片捕获组织中的mRNA,通过时空条形码(Coordinate ID,CID)还原回空间位置,并将总mRNA的空间信息与形态学内容相结合,并绘制所有基因表达发生的位置,获得生物过程复杂而完整的基因表达图谱。单细胞测序技术,解决了细胞间的异质性问题;而时空组学则在此基础上解决了细胞空间分布的问题,对于细胞生命活动的调控机制和细胞谱系发生过程的研究具有重要意义。
网友评论