源网站:分子标记概述 (cgris.net) (仅用作个人学习,侵删)
分子标记的种类及其发展
黎裕 贾继增 王天宇
(中国农科院作物品种资源研究所,北京100081)
本文刊登于“生物技术通报”1999年第4期19-22页
1 引言
1.1 分子标记概念的界定
广义的分子标记(molecular marker)是指可遗传的并可检测的DNA序列或蛋白质。蛋白质标记包括种子贮藏蛋白和同工酶(指由一个以上基因位点编码的酶的不同分子形式)及等位酶(指由同一基因位点的不同等位基因编码的酶的不同分子形式)。狭义的分子标记概念只是指DNA标记,而这个界定现在被广泛采纳。本文中也将分子标记概念限定在DNA标记范畴。
1.2 理想的分子标记的界定
理想的分子标记必须达到以下几个要求:(1)具有高的多态性;(2)共显性遗传,即利用分子标记可鉴别二倍体中杂合和纯合基因型;(3)能明确辨别等位基因;(4)遍布整个基因组;(5)除特殊位点的标记外,要求分子标记均匀分布于整个基因组;(6)选择中性(即无基因多效性);(7)检测手段简单、快速(如实验程序易自动化);(8)开发成本和使用成本尽量低廉;(9)在实验室内和实验室间重复性好(便于数据交换)。
但是,目前发现的任何一种分子标记均不能满足以上所有要求。
2 分子标记的种类
2.1 限制性片段长度多态性
2.1.1 限制性片段长度多态性(restriction fragment length polymorphism,缩写RFLP)是发展最早的分子标记技术。RFLP技术的原理是检测DNA在限制性内切酶酶切后形成的特定DNA片段的大小。因此凡是可以引起酶切位点变异的突变如点突变(新产生和去除酶切位点)和一段DNA的重新组织(如插入和缺失造成酶切位点间的长度发生变化)等均可导致RFLP的产生。此技术及其从中发展出来的一些变型均包括以下基本步骤:DNA的提取、用限制性内切酶酶切DNA、用凝胶电泳分开DNA片段、把DNA片段转移到滤膜上、利用放射性标记的探针显示特定的DNA片段(通过Southern杂交)、分析结果。由于线粒体和叶绿体DNA较小,前三个步骤就完全可能检测出DNA片段的差异,所以往往不必要后面的几个步骤;对线粒体和叶绿体DNA进行的这种多态性差异检测在1980年之前就已出现,从理论上说,这种多态性也可称为RFLP。
2.1.2 一般选择单拷贝探针。但如果RFLP探针是来自拷贝数可变串联重复(Varible number of tandem repeats,缩写VNTR),则产生另一类因相同或相近序列的拷贝数变化所引起的多态性。凡是引起重复单位的大小和序列不同、基因组中重复的数目和分布不同等均可导致这种多态性的产生。在RFLP技术中有特殊用途(成为分子标记)的重复序列包括:(1) 小卫星(minisatellite)序列:重复单位(motif)约有碱基10-60个(也有16-100个碱基一说),在基因组中多次出现。(2) 微卫星(microsatellite)或简单重复序列(simple sequence repeats,缩写SSR):重复单位含有1-5个碱基(也有2-8个碱基一说)(microsatellite一词由Litt & Luty(1989) 〔11〕提出)。
2.2以PCR(聚合酶链式反应)为基础的分子标记
2.2.1 随机扩增多态性DNA(random amplified polymorphic DNA,缩写RAPD):
2.2.1.1基本原理和特点:该技术用一个(有时用两个)随机引物(一般8-10个碱基)非定点地扩增DNA片段,然后用凝胶电泳分开扩增片段。其特点包括:(1)不需DNA探针,设计引物也不需要知道序列信息;(2)用一个引物就可扩增出许多片段(一般一个引物可扩增6-12条片段,但对某些材料可能不能产生扩增产物),总的来说RAPD在检测多态性时是一种相当快速的方法;(3)技术简单,RAPD分析不涉及Southern杂交、放射自显影或其它技术;(4)不象RFLP分析,RAPD分析只需少量DNA样品;(5)成本较低,因为随机引物可在公司买到,其价格不高;(6)RAPD标记一般是显性遗传(极少数是共显性遗传的),这样对扩增产物的记录就可记为“有/无”,但这也意味着不能鉴别杂合子和纯合子;(8)RAPD分析中存在的最大问题是重复性不太高,因为在PCR反应中条件的变化会引起一些扩增产物的改变;但是,如果把条件标准化,还是可以获得重复结果的〔12〕;(9)由于存在共迁移问题,在不同个体中出现相同分子量的带后,并不能保证这些个体拥有同一条(同源)的片段;同时,在胶上看见的一条带也有可能包含了不同的扩增产物,因为所用的凝胶电泳类型(一般是琼脂糖凝胶电泳)只能分开不同大小的片段,而不能分开有不同碱基序列但有相同大小的片段。
2.2.1.2 RAPD技术的发展和相近的分子标记种类:下面提到的所有技术都是利用一个或两个短的富含GC碱基的随机引物:
DAF(DNA amplification fingerprinting):与RAPD技术不同的是,在DAF分析中,引物浓度更高,引物长度更短(一般5-8个碱基),只有两个温度循环(在RAPD中是三个温度循环),并且往往用聚丙烯酰胺凝胶电泳,DAF通常会产生非常复杂的带型〔5〕。在DAF技术从基础上,又发展出了ASAP技术(arbitrary signatures from amplification profiles)(使用了不同引物)〔4〕。
AP-PCR(arbitrarily primed polymerase chain reaction):在AP-PCR分析中,扩增分为三个部分,每个部分要求的条件和组分的浓度存在差异;在第一个PCR循环中,引物浓度较高;引物长度不定,并且常常来自为其它目的而设计的引物(如M13通用测序引物)〔20〕。
MAAP(Multiple Arbitrary Amplicon Profiling):这是Caetano-Anolles (1994) 〔3〕创造的一个词,想用来统称所有这些相关技术,但迄今为止这个词很少使用。
2.2.2 特定序列位点
特定序列位点(sequence-tagged site,缩写STS)是对由其特定引物序列所界定的一类标记的统称。利用特异PCR技术的最大优点是它产生的信息非常可靠,而不象RAPD、AFLP和利用随机探针产生的RFLP存在某种模糊性(如难以鉴别片段的来源)。这类分子标记主要包括以下几种分子标记:
2.2.2.1 STMS(Sequence-tagged microsatellites):通常又称为SSR,也可称为SSRP(Simple Sequence Repeat Polymorphisms)
2.2.2.1.1基本原理和特点:引物根据与微卫星重复序列两翼的特定短序列设计,用来扩增重复序列本身。由于重复的长度变化极大,所以这是检测多态性的一种有效方法。其特点包括:一般检测到的是一个单一的多等位基因位点;共显性遗传,故可鉴别杂合子和纯合子;得到的结果重复性很高。为了提高分辨力,通常使用聚丙烯酰胺凝胶电泳,它可检测出单拷贝差异。也可以在同一个反应试管中把PCR反应与不同的STMS引物结合起来(称为multiplexing),这可节省时间,但是,这只能在不同引物的产物在大小上不重叠的情况下才能使用。很显然,使用STMS技术的前提是需要知道重复序列两翼的DNA序列的信息,这一方面可以在其它种的DNA数据库中查询,否则就必须先建立含有微卫星的基因组文库,再从中筛选可用的克隆,进行测序,然后设计合适的引物。
2.2.2.1.2 STMS的发展和相近的分子标记种类:
把与SSR互补的寡核苷酸作为多位点RFLP技术中的探针
把与SSR互补的寡核苷酸作为PCR引物(可单独作引物或与随机引物配合使用),扩增的是基因组DNA的特定片段:即MP-PCR〔7〕和RAMPs〔21〕
用标记的SSR探针与RAPD扩增片段杂交:即RAMPO〔15〕或称为RAHM或RAMS
用5?或3?端加锚的SSR作引物(如GG[CA]7):即ISSR〔23〕, 见2.2.2.2
2.2.2.2 加锚微卫星寡核苷酸(Anchored microsatellite oligonucleotides)
Zietkiewicz et al.(1994) 〔23〕对STMS技术进行了发展,他们用加锚微卫星寡核苷酸作引物,对基因组节段而不是重复序列本身进行扩增。在SSR的5?端或3?端加上2-4个随机选择的核苷酸,这可引起特点位点退火。这样就能导致位于反向排列的间隔不太大的重复序列间的基因组节段进行PCR扩增。这类标记又被称为ISSR (inter-simple sequence repeat)〔23〕、ASSR(anchored simple sequence repeats) 〔17〕或AMP-PCR〔18〕。这类标记往往是显性遗传的。在所用的两翼引物中,可以一个是ASSR引物,另一个是随机引物〔17〕。如果一个是5?端加锚的ASSR引物,另一个是随机引物,则被RAMP技术〔21〕。
2.2.2.3 SCAR(Sequence-characterized amplified regions)
SCAR标记是在RAPD技术的基础上发展起来的〔14〕。其基本步骤是:先作RAPD分析,然后把目标RAPD片段(如与某目的基因连锁的RAPD片段)进行克隆和测序,根据原RAPD片段两末端的序列设计特定引物(一般比RAPD引物长,通常24个碱基),再进行PCR特异扩增,这样就可把与原RAPD片段相对应的单一位点鉴定出来。这样的位点就称为SCAR。SCAR比RAPD和其它利用随机引物的方法在基因定位和作图中的应用更好,因为它有更高的可重复性(原因是使用的引物长),标记是共显性遗传的。
2.2.2.4 CAPS (Cleaved amplified polymorphic sequence)
CAPS技术又可称为PCR-RFLP。所用的PCR引物是针对特定的位点而设计的。其基本步骤是:先进行PCR扩增,然后将PCR扩增产物用限制性内切酶酶切,再用琼脂糖凝胶电泳将DNA片段分开,用EB染色,观察〔10〕。与RFLP技术一样,CAPS技术检测的多态性其实是酶切片段大小的差异。在酶切前进行PCR产物检测,其多态性称为ALP〔6〕。Neff et al. (1998) 〔13〕在此基础上又发展出dCAPS技术(derived CAPS),这是检测单核苷酸多态性的一种良好方法。
2.2.2.5 SPAR (single primer amplification reaction)
SPAR技术与RAPD技术相似的是也只用一个引物,但SPAR分析中所用的引物不是随机的,而是在SSR的基础上设计的,例如可能的序列是(TA)10或(CGA)6。扩增的是SSR之间的DNA序列〔8〕。又称为MP-PCR(microsatellite-primed PCR) 〔19〕 。
2.2.2.6 DAMD (directed amplification of minisatellite region DNA)
直接用小卫星的核心序列作引物进行扩增。
2.2.2.7 Inter-Alu PCR like genomic profiling
与SPAR技术相近,也只用一个引物,但所用的引物是在Alu序列(为中等重复序列)的基础上设计的,扩增的是Alu序列之间的DNA序列〔2〕。
2.2.2.8 ISTR (inverse sequence-tagged repeat)
这种技术与SPAR技术也相近,也所用的引物是在copia序列〔反向重复序列〕的基础上设计的,扩增的是copia序列之间的DNA序列〔16〕。
2.2.2.9 IFLP (intron fragment length polymorphism)
检测的对象是内含子的长度差异〔9〕。
2.2.2.10 RAMPO (random amplified microsatellite polymorphism)
RAMPO的英文全名与RAMP的英文全名相近,但实验方法却不同。RAMPO的基本步骤是:先用一个单一的随机引物(即RAPD引物)对基因组DNA扩增,用电泳将扩增片段分开,然后,把凝胶转移到尼龙膜上,使之与一个带有放射性标记(或其它标记)的与SSR互补的寡核苷酸探针(如[CA]8和[ga]8)杂交,放射自显影后可得到新的多态性类型〔15〕。
2.2.2.11 先找到RFLP标记后,对RFLP探针进行测序,再合成适当的PCR引物,这样可发现新的STS标记。这也可称为RFLP-PCR。
2.2.3 扩增片段长度多态性(Amplified Fragment Length Polymorphism,缩写AFLP):其特点是把RFLP和PCR结合了起来。其基本步骤是:把DNA进行限制性内切酶酶切,然后选择特定的片段进行PCR扩增(在所有的限制性片段两端加上带有特定序列的“接头”,用与接头互补的但3?端有几个随机选择的核苷酸的引物进行特异PCR扩增,只有那些与3?端严格配对的片段才能得到扩增),再在有高分辨力的测序胶上分开这些扩增产物,用放射性法、荧光法或银染染色法均可检测之。这种技术又称为“选择性限制性片段扩增”〔22〕。Arencibia et al. (1998) 〔1〕在AFLP的基础上发展出AFRP技术(amplified fragment random polymorphism),加的PCR引物中一侧为AFLP引物,一侧为随机引物。
2.2.4单核苷酸多态性(single nucleotide polymorphism,缩写SNP)技术
同一位点的不同等位基因之间常常只有一个或几个核苷酸的差异,因此在分子水平上对单个核苷酸的差异进行检测是很有意义的。目前SNP作为一种新的分子标记,已有2000多个标记定位于人类染色体上,在植物上也在进行开发研究。可在胶上也可不在胶上就能检测出SNP,但检测SNP的最佳方法是新近发展起来的DNA芯片技术。
参考文献
Arencibia A et al. Mol. Breed. 1998, 4:99-109.
Baurens F-C et al. Euphytica 1998, 99:137-142.
Caetano-Anolles G. Plant Mol. Biol. 1994, 25:1011-1026.
Caetano-Anolles G & PM Gresshoff. Biotechniques 1996, 20:1044-1056.
Caetano-Anolles G et al. Bio/Technology 1991, 9: 553-557.
Gharzeyazie B et al. Theor. Appl. Genet. 1995, 91:218-227.
Gupta M et al. Theor. Appl. Genet. 1994, 998-1006.
Gupta PK et al. Current Sci. 1996, 70:45-54.
Hongtrakul V et al. Mol. Breed. 1998, 4:195-203.
Konieczny A & FM Ausubel. Plant J. 1993, 4:403-410.
Litt M & AJ Luty. Amer. J. Human Genet. 1989, 44:397-401.
Lowe AJ et al. Plant Genetic Resources Newsl. 1996, 107:50-54.
Neff MM et al. Plant J. 1998, 14:387-392.
Paran I & RW Michelmore. Theor. Appl. Genet. 1993, 85:985-993.
Richardson T et al. Nucl. Acids Res. 1995, 23:3798-3799.
Rohde W J. Genet. & Breed. 1996, 50:249-261.
Wang G et al. Theor. Appl. Genet. 1998, 96:1086-1096.
Weising K et al. J. Crop Prod. 1998, 1:113-143.
Weising K et al. PCR Methods Appl. 1995, 4: 249-255.
Welsh J & M McClelland. Nucl. Adics Res. 1990, 18: 7213-7218.
Wu KS et al. Nucl. Acids Res. 1994, 22:3257-3258.
Zabeau M, 1993. European Patent Application. Publication No. 0 534 858 A1.
Zietkiewicz E et al. Genomics 1994, 20: 176-183.
网友评论