分子标记是以个体间遗传物质内核苷酸序列变异为基础的遗传标记,是DNA水平遗传多态性的直接的反映。与其他几种遗传标记——形态学标记、生物化学标记、细胞学标记相比,DNA分子标记具有的优越性有:大多数分子标记为共显性,对隐性的性状的选择十分便利;基因组变异极其丰富,分子标记的数量几乎是无限的;在生物发育的不同阶段,不同组织的DNA都可用于标记分析;分子标记揭示来自DNA的变异;表现为中性,不影响目标性状的表达,与不良性状无连锁;检测手段简单、迅速。随着分子生物学技术的发展,现在DNA分子标记技术已有数十种,广泛应用于遗传育种、基因组作图、基因定位、物种亲缘关系鉴别、基因库构建、基因克隆等方面。
分子标记的概念有广义和狭义之分。广义的分子标记是指可遗传的并可检测的DNA序列或蛋白质。狭义分子标记是指能反映生物个体或种群间基因组中某种差异的特异性DNA片段。
理想的分子标记必须达以下几个要求:(1) 具有高的多态性;(2)共显性遗传,即利用分子标记可鉴别二倍体中杂合和纯合基因型;(3) 能明确辨别等位基因;(4) 遍布整个基因组;(5)除特殊位点的标记外,要求分子标记均匀分布于整个基因组;(6) 选择中性(即无基因多效性);(7)检测手段简单、快速(如实验程序易自动化);(8) 开发成本和使用成本尽量低廉;(9)在实验室内和实验室间重复性好(便于数据交换)。但是,目前发现的任何一种分子标记均不能满足以所有要求。
【分子标记的种类】
一、基于分子杂交技术的分子标记技术
此类标记技术是利用限制性内切酶解及凝胶电泳分离不同的生物 DNA 分子,然后用经标记的特异 DNA 探针与之进行杂交,通过放射自显影或非同位素显色技术来揭示 DNA 的多态性。
① 限制性片段长度多态性(Restriction Fragment Length Polymorphism,RFLP)
1974年Grodzicker等创立了限制性片段长度多态性(RFLP)技术,它是一种以DNA—DNA杂交为基础的第一代遗传标记。RFLP基本原理:利用特定的限制性内切酶识别并切割不同生物个体的基因组DNA,得到大小不等的DNA片段,所产生的DNA数目和各个片段的长度反映了DNA分子上不同酶切位点的分布情况。通过凝胶电泳分析这些片段,就形成不同带,然后与克隆DNA探针进行Southern杂交和放射显影,即获得反映个体特异性的RFLP图谱。它所代表的是基因组DNA在限制性内切酶消化后产生片段在长度上差异。由于不同个体的等位基因之间碱基的替换、重排、缺失等变化导致限制内切酶识别和酶切发生改变从而造成基因型间限制性片段长度的差异。
RFLP的等位基因其有共显性特点。RFLP标记位点数量不受限制,通常可检测到的基因座位数为1—4个。RFLP技术也存在一些缺陷,主要是克隆可表现基因组DNA多态性的探针较为困难;另外,实验操作较繁锁,检测周期长,成本费用也很高。自RFLP问世以来,已经在基因定位及分型、遗传连锁图谱的构建、疾病的基因诊断等研究中仍得到了广泛的应用。
② 数目可变串联重复多态性(Variable Number of Tandem Repeats,VNTR )
数目可变串联重复序列又称小卫星DNA (MinisatelliteDNA),是一种重复DNA小序列,为10到几百核苷酸,拷贝数10一10001不等。VNTR基本原理与RFLP大致相同,只是对限制性内切酶和DNA探针有特殊要求:(1)限制性内切酶的酶切位点必须不在重复序列中,以保证小卫星或微卫星序列的完整性。(2)内切酶在基因组的其他部位有较多酶切位点,则可使卫星序列所在片段含有较少无关序列,通过电泳可充分显示不同长度重复序列片段的多态性。(3)分子杂交所用DNA探针核昔酸序列必须是小卫星序列或微卫星序列,通过分子杂交和放射自显影后,就可一次性检测到众多小卫星或微卫星位点,得到个体特异性的DNA指纹图谱。
小卫星标记的多态信息含量较高,在17一19之间。缺点是数量有限,而且在基因组上分布不均匀,这就极大限制其在基因定位中的应用。VNTR也存在实验操作繁琐、检测时间长、成本高的缺点。
二、基于PCR技术的分子标记技术
(一)、随机引物的PCR标记
所用引物的核苷酸序列是随机的,其扩增的 DNA 区域事先未知。随机引物PCR扩增的DNA 区段产生多态性的分子基础是模板 DNA扩增区段上引物结合位点的碱基序列的突变,不同来源的基因组在该区段上表现为扩增产物有无差异或扩增片段大小的差异。随机引物PCR标记表现为显性或共显性。
① 随机扩增多态性DNA (Random Amplified Polymorphism DNA,RAPD )
RAPD技术是1990年由Wiliam和Welsh等人利用PCR技术发展的检测DNA多态性的方法。基本原理:它是利用随机引物(一般为8—10bp)通过PCR反应非定点扩增DNA片段,然后用凝胶电泳分析扩增产物DNA片段的多态性。扩增片段多态性便反映了基因组相应区域的DNA多态性。RAPD所使用的引物各不相同,但对任一特定引物,它在基因组DNA序列上有其特定的结合位点,一旦基因组在这些区域发生DAN片段插人、缺失或碱基突变,就可能导致这些特定结合位点的分布发生变化,从而导致扩增产物数量和大小发生改变,表现出多态性。就单一引物而言,其只能检测基因组特定区域DNA多态性,但利用一系列引物则可使检测区域扩大到整个基因组,因此,RAPD可用于对整个基因组DNA进行多态性检测,也可用于构建基因组指纹图谱。
与RFLP相比,RAPD具有以下优点:(1)技术简单,检测速度快;(2)RAPD分析只需少量DNA样品;(3)不依赖于种属特异性和基因组结构,一套引物可用于不同生物基因组分析;(4)成本较低。但RAPD也存在一些缺点:(1)RAPD标记是一个显性标记,不能鉴别杂合子和纯合子;(2)存在共迁移问题,凝胶电泳只能分开不同长度DNA片段,而不能分开那些分子量相同但碱基序列组成不同的DNA片段;(3) RAPD技术中影响因素很多,所以实验的稳定性和重复性差。
② 任意引物PCR (Arbitrarily Primed Polymerase Chain Reaction, AP—PCR)
在AP—PCR分析中,所使用的引物较长(10-50 bp) ,PCR反应分为两个阶段,首先寡核昔酸引物在低严谨条件下与模板DNA退火,此时发生了一些合成,以便稳定模板与引物之间相互作用。然后进行高严谨退火条件的循环,两个位点间那些序列在低严谨度退火条件下发生的引物延伸可继续在高严谨条件下扩增。采用变性聚丙烯酞胺凝胶电泳分析PCR产物,最终反应结果与RAPD类似。只要设计的引物在低严谨退火条件下能减少引物产生人为产物,应用成对组合的引物可以产生新的AP—PCR谱带,但引物配对组合使用时,得到的图谱与单引物单独使用时产生的图谱之和很不相同,这样,50个引物能产生1250种不同指纹图谱。
AP—PCR方法不需预知序列资料,而且检测的基因组样本是任意的,还能够用于检测近等基因系(或同类系)中的多态性。AP—PCR的缺点是每个新的多态性都必须经纯化才能进一步使用。另外,此方法在杂合体中仅可辨别长度多态性。
③ DNA扩增指纹印迹(DNA Amplification Fingerprinting,DAF)
DAF是一种改进的RAPD分析技术,与RAPD技术不同的是,DAF分析中所使用的引物浓度更高,长度更短(一般为5一8bp),因此它所提供的谱带信息比RAPD大得多,如当使用5个核昔酸的引物时,引物和模板的组合大约可扩增出10一100个DNA片段。PCR扩增产物是在凝胶上进行分离,通过银染即可产生非常复杂带型。
(二)、特异引物的PCR标记
特异引物的PCR标记所用引物是针对已知序列的 DNA 区段而设计的,具有特定核苷酸序列(通常为 18—24 bp),可在常规PCR复性温度下进行扩增,对基因组 DNA 的特定区域进行多态性分析。
① 序列标志位点(Sequence Tagged Sites,STS)
STS是对以特定对引物序进行PCR特异扩增的一类分子标记的统称。通过设计特定的引物,使其与基因组DNA序列中特定结合位点结合,从而可用来扩增基因组中特定区域,分析其多态性。利用特异PCR技术的最大优点是它产生信息非常可靠,而不像RFLP和RAPD那样存在某种模糊性。
② 简单重复序列(Simple Sequence Repeat,SSR)
简单重复序(SSR)也称微卫星DNA,其串联重复的核心序列为1一6 bp,其中最常见是双核昔酸重复,即(CA) n和(TG)n每个微卫星DNA的核心序列结构相同,重复单位数目10一60个,其高度多态性主要来源于串联数目的不同。SSR标记的基本原理:根据微卫星序列两端互补序列设计引物,通过PCR反应扩增微卫星片段,由于核心序列串联重复数目不同,因而能够用PCR的方法扩增出不同长度的PCR产物,将扩增产物进行凝胶电泳,根据分离片段的大小决定基因型并计算等位基因频率。
SSR具有以下一些优点:(l)一般检测到的是一个单一的多等位基因位点;(2)微卫星呈共显性遗传,故可鉴别杂合子和纯合子;(3)所需DNA量少。显然,在采用SSR技术分析微卫星DNA多态性时必须知道重复序列两端的DNA序列的信息。如不能直接从DNA数据库查寻则首先必须对其进行测序。
③ 序列特异性扩增区(Sequence—characterized Amplified Region,SCAR)
SCAR标记是在RAPD技术基础上发展起来的。SCAR标记是将目标 RAPD片段进行克隆并对其末端测序,根据 RAPD 片段两端序列设计特异引物,对基因 DNA片段再进行PCR特异扩增,把与原RAPD片段相对应的单一位点鉴别出来。SCAR标记是共显性遗传,待检 DNA间的差异可直接通过有无扩增产物来显示。SCAR标记方便、快捷、可靠,可以快速检测大量个体,结果稳定性好,重现性高。
④ 单引物扩增反应(Single Primer Amplificatipn Reawtion,SPAR)
SPAR技术是与RAPD技术相似的一种标记技术,SPAR也只用一个引物,但所用的引物是在SSR的基础上设计的。这些引物能与SSR之间的间隔序列进行特异性结合,然后通过P(:R技术扩增SSR之间的DNA序列,凝胶电泳分离扩增产物,分析其多态性。另外,还有一种与SPAR技术非常相似的标记技术,即ISTR ( Inverse Sequence—taggedRepeat)技术,ISTR所用的引物是在反向重复序列基础上设计的,PCR扩增的是反向重复序列之间的DIVA序列。
⑤ DNA单链构象多态性(Single Strand Conformation Polymorphism,SSCP)
SSCP是指等长的单链DNA因核昔酸序列的差异而产生构象变异,在非变性聚丙烯酞胺中的表现为电泳迁移率的差别。单链DNA构象分析对DNA序列的改变非常敏感,常常一个碱基差别都能显示出来。在SSCP分析中,利用PCR技术定点扩增基因组DNA中某一目的片段,将扩增产物进行变性处理,双链DNA分开成单链,再用非变性聚丙烯酞胺凝胶电泳分离,根据条带位置变化来判断目的片段中是否存在突变。SSCP结果判定是通过多个样品之间对比,观察条带之间位置改变,从而显示出不同生物个体的DNA特异性,达到指纹分析目的。为了进一步提高SSCP的检出率,可将SSCP分析与其它突变检测方法相结合。其中与杂交双链分析(Heterocluplexanalysis,Het)法结合可以大大提高检出率。Het法是用探针与要检测的单链DNA或RNA进行杂交,含有一对碱基对错配的杂交链可以和完全互补的杂交链在非变性PAG凝胶上通过电泳被分离开。对同一靶序列分别进行SSCP和Het分析可以使点突变的检出率接近100%,而且实验简便。
⑥ 双脱氧化指纹法(Dideoxy Fingerprints,ddF )
ddF是将双脱氧末端终止测序法与SSCP结合起来的分析技术,对由双脱氧末端终止的长短不一的单链DNA进行SSCP分析。如果目的片段存在一个突变,则所有大于某一大小对应于突主变位置的双脱氧终止片段无野生型系统,对于每一个突有多次机会检测其迁移率改变,提高了检测突变的效率。ddF方法克服了SSCP分析时因DNA长度影响SSCP显示的困难,通过一种双脱氧核昔酸生产特异性的单链DNA,使其中长度合适的DNA片段显示SSCP改变。
三、基于限制性酶切和PCR技术的DNA标记
① 扩增片段长度多态性(Amplified Fragment Length Polymorphism,AFLP )
AFLP是1993年荷兰科学家Zbaeau和Vos发展起来的一种检测DNA多态性的新方法。AFLP 是 RFLP 与PCR相结合的产物,其基本原理是先利用限制性内切酶水解基因组 DNA 产生不同大小的 DNA片段,再使双链人工接头的酶切片段相边接,作为扩增反应的模板 DNA,然后以人工接头的互补链为引物进行预扩增,最后在接头互补链的基础上添加1—3个选择性核苷酸作引物对模板 DNA基因再进行选择性扩增,通过聚丙烯酰胺凝胶电泳分离检测获得的DNA扩增片段,根据扩增片段长度的不同检测出多态性。引物由三部分组成:与人工接头互补的核心碱基序列、限制性内切酶识别序列、引物3’端的选择碱基序列(1—10bp)。接头与接头相邻的酶切片段的几个碱基序列为结合位点。该技术的独特之处在于所用的专用引物可在知道 DNA信息的前提下就可对酶切片段进行PCR 扩增。为使酶切浓度大小分布均匀,一般采用两个限制性内切酶,一个酶为多切点,另一个酶切点数较少,因而AFLP 分析产生的主要是由两个酶共同酶切的片段。AFLP 结合了 RFLP 和RAPD两种技术的优点,具有分辨率高、稳定性好、效率高的优点。但它的技术费用昂贵,对 DNA 的纯度和内切酶的质量要求很高。尽管 AFLP技术诞生时间较短,但可称之为分子标记技术的又一次重大突破,被认为是目前一种十分理想、有效的分子标记。
② 酶切扩增多态性序列(Cleaved Amplified Polymorphism Sequences,CAPS )
CAPS技术又称为PCR—RFLP,它实质上是PCR技术与RFLP技术结合的一种方法。CAPS的基本原理是利用己知位点的DNA序列资源设计出一套特异性的PCR引物(19—27bp),然后用这些引物扩增该位点上的某一DNA片段,接着用一种专一性的限制性内切酶切割所得扩增产物,凝胶电泳分离酶切片段,染色并进行RFLP分析。GAPS标记揭示的是特异PGR片段的限制性长度变异的信息。CAPS是一类共显性分子标记,其优点是避免了RFLP分析中膜转印这一步骤,又能保持RFLP分析的精确度。另外,由于很多限制性内切酶均可与扩增DNA酶切,所以检测到多态性机会较大。
四、基于DNA芯片技术的分子标记技术
核苷酸多态性(Single Nucleotide Polymorphism,SNP)
SNP标记是美国学者LanderE于1996年提出的第三代DNA遗传标记。SNP是指同一位点的不同等位基因之间仅有个别核苷酸的差异或只有小的插入、缺失等。从分子水平上对单个核苷酸的差异进行检测,SNP 标记可帮助区分两个个体遗传物质的差异。人类基因组大约每 1000 bp SNP出现一次,已有2000多个标记定位于人类染色体,对人类基因组学研究具有重要意义。检测 SNP 的最佳方法是 DNA 芯片技术。SNP被称为第三代 DNA 分子标记技术,随着 DNA 芯片技术的发展,其有望成为最重要最有效的分子标记技。
【分子标记的应用领域】
(一)、基因组作图和基因定位研究
长期以来,各种生物的遗传图谱几乎都是根据诸如形态、生理和生化等常规标记来构建的,所建成的遗传图谱仅限少数种类的生物,而且图谱分辨率大多很低,图距大,饱和度低,因而应用价值有限。分子标记用于遗传图谱构建是遗传学领域的重大进展之一。随着新的标记技术的发展,生物遗传图谱名单上的新成员将不断增加,图谱上标记的密度也将越来越高。建立起完整的高密度的分子图谱,就可以定位感兴趣的基因。
(二)、基于图谱克隆基因
图位克隆(Map—bascdcloning))是近几年随着分子标记遗传图谱的相继建立和基因分子定位而发展起来的一种新的基因克隆技术。利用分子标记辅助的图位克隆无需事先知道基因的序列,也不必了解基因的表达产物,就可以直接克隆基因。图位克隆是最为通用的基因识别途径,至少在理论上适用于一切基因。基因组研究提供的高密度遗传图谱、大尺寸物理图谱、大片段基因组文库和基因组全序列,已为图位克隆的广泛应用铺平了道路。
(三)、物种亲缘关系和系统分类中的应用
分子标记广泛存在于基因组的各个区域,通过对随机分布于整个基因组的分子标记的多态性进行比较,就能够全面评估研究对象的多样性,并揭示其遗传本质。利用遗传多样性的结果可以对物种进行聚类分析,进而了解其系统发育与亲缘关系。分子标记的发展为研究物种亲缘关系和系统分类提供了有力的手段。
(四)、用于疾病诊断和遗传病连锁分析
1980年,Bostein等成功的将PFLP技术用于镰刀型贫血症的诊断分析,开创了基因诊断的先河。PFLP是以孟德尔方式遗传,因此可以作为染色体上致病基因座位的遗传标志。目前,许多与相连锁的致病基因得以定位。小卫星和微卫星因其高度多态性而被广泛用于疾病诊断和遗传病的连锁分析。随着高通量SNP检测技术方法的出现,作为数量最多且易于批量检测的多态标记,SNP在连锁分析与基因定位,包括复杂疾病的基因定位、关联分析、个体和群体对环境致病因子与药物的易感性研究中将发挥愈来愈重要的作用。
【分子标记技术的展望】
目前,分子标记技术已飞速发展,并被广泛应用于动植物的遗传研究中。分子标记中的已在玉米、大豆、鸡、猪等动植物育种和生产中有许多应用研究,主要集中在基因定位、辅助育种、疾病治疗等方面的应用研究工作,取得了一些应用成果。分子标记技术的开发是近年来分子生物学领域研究的热点。随着分子生物学理论与技术的迅猛发展,必将研发出分析速度更快、成本更低、信息量更大的分子标记技术。而分子标记技术与提取程序化、电泳胶片分析自动化、信息(数据)处理计算机化的结合,必将加速遗传图谱的构建、基因定位、基因克隆、物种亲缘关系鉴别及与人类相关的致病基因的诊断和分析。