基础
测序深度: 指测序得到的总碱基数与待测基因组大小的比值。假设一个基因大小为2M,测序深度为10X,如果是全基因覆盖的话,那么获得的总数据量为20M。
覆盖度: 指测序获得的序列占整个基因组的比例。由于基因组中的高GC、重复序列等复杂结构的存在,测序最终拼接组装 获得的序列往往无法覆盖有所的区域,这部分没有获得的区域就称为Gap。例如一个细菌基因组测序,覆盖度是98 %,那么还有2%的序列区域是没有通过测序获得的。(你想实际测到的内容占想测内容的比例。)
全外显子测序(Exome-seq)
首先外显子组(Exome)是指真核生物基因组中全部外显子区域的总和,包含了蛋白质合成最直接的信息。外显子组测序(Exome-seq)是利用设计好的探针将坐标已知的全基因组外显子区域的DNA捕捉并富集后,进行高通量测 序的基因组分析方法。 对于人类基因组来说,外显子区域大概占到基因组的1%,大概在30M左右。一般全外显子测序的测序深度 为50X~200X,具体深度依研究目的而定,其个体之间的变异小(在VCF文件上记录着少许差异,一点点)。
转录组测序(RNA-seq)
首先转录组是指在相同环境(或生理条件)下的在一个细胞、或一群细胞中所能转录出的所有RNA的总和,包括信使RNA(mRNA)、核糖体RNA(rRNA)、转运RNA(tRNA)及非编码RNA。转录组测序(RNA-seq)是将提取所要研究的特定类型的RNA,将其反转录成cDNA,利用高通量测序技术获得某一物种特定组织或器官在某一状态下的几乎所有转录本序列信息。对于已知参考基因组的物种,所获得大部分序列是已知的,同时会有一些新的转录本会被检测到,几乎可以忽略;甚至处于不同状态的人,其转录组数据有所不同。因此其主要的研究点——研究随着时空的变化、组织的变化、样本的变化,转录本发生改变。
染色质免疫共沉淀测序(ChIP-seq)
主要用于蛋白质与DNA相互作用研究,采用特异抗体对目的蛋白进行免疫沉淀,分离与目的蛋白结合的基因组DNA片段,对其进行纯化和文库构建,再通过高通量测序的方法,在全基因组范围内寻找目的蛋白的DNA结合位点,从而获得全基因组范围内与组蛋白、转录因子等互作的DNA片段信息。(与外显子测序不一样,不是通过设计好的探针来捕获序列的,而是通过特异的RNApoly酶、组蛋白、转录因子来捕获序列的,蛋白结合在哪里就捕获哪里。每做一次实验,换一个蛋白,所捕获的序列是不一样的。)因此其主要研究点——研究用不同组蛋白、转录因子等不同蛋白来做不同的实验,找出互作的DNA序列的不同。
网友评论