一、何为 SSR ?
SSR ( simple sequence repeats ) 即简单重复序列,也称为微卫星 DNA(microsatellite DNA ),在真核生物基因组中广泛存在,一般是以1-bp 组成较低程度的重复序列,主要以2-3个核酸为重复单位如(GA)n、(AC)n 和(GAA)n 等。
从进化角度看物种间重复序列的差异是自然选择的结果。因此鉴定SSR在基因组分析中有重要意义。微卫星在原核生物和真核生物基因组中随机分布,而且该标记呈共显性,符合孟德尔遗传模式,易于操作,具有高度重复性和可靠性,显示出较强的多态性等优点,使其在遗传连锁图谱构建、遗传多样性检测、基因定位及分子标记辅助选择等领域有重要应用
SSR 通常可以分为基因组 SSR 和 EST-SSR 两大类。GenomicSSR 是基于基因组序列开发的,开发起来费时费力,而且因为探针的缘故,种类比较局限,EST-SSR是指存在于表达的基因序列内的SSR,不包括存在于内含子及非表达的调控区等之中的SSR,通常三个碱基重复的占多数,与不引起基因翻译过程中移码现象的发生相一致,EST-SSR有更强的种属转移性。不过一般EST-SSR的重复序列要短于基因组中的SSR,而且从EST中筛选的微卫星要比从基因组中筛选的微卫星多态性低。
二、使用 Misa 结合 Primer3 来批量设计 SSR 引物
MISA,英文全称为Micro Satellite identification tool,即微卫星识别工具。
MISA是使用 perl 编写的一支程序,能识别出序列中的微卫星和复合微卫星(两个微卫星之间由由不多于100bp的碱基对隔开),并给出其所在位点。
MISA下载网址:http://pgrc.ipk-gatersleben.de/misa/misa.html
1. MISA 用法:
misa.pl filename
其中,fastfile是序列文件,同时在运行程序的工作目录下必须有一个名称为“misa.ini”
的文件。该文件内容为:
definition(unit_size,min_repeats): 1-10 2-6 3-5 4-5 5-5 6-5
interruptions(max_difference_for_2_SSRs): 100
该文件指定了misa的参数,即1个碱基重复10次及10次以上;2个碱基重复6次及6 次以上;
3个碱基重复5次及5次以上;4个碱基重复5次及5次以上;5个碱基重复5 次及5次以上;6碱
基重复5次及5次以上,这样的碱基重复序列才算是微卫星序列。 同时,两个微卫星之间的距离小于100bp的时候,两个微卫星组成一个复合微卫星。
MISA的输出结果:
MISA会在 fastafile 所在的文件夹下生成两个文件,分别是 “.misa” 和 “.statistics”
-
.misa
:以表格的形式列出微卫星的类型和位点; -
.statistics
:统计微卫星的类型和频数。
在MISA的下载页面中,提供了3个附加的 perl 脚本,分别是:Get_est_trimmer.pl
,p3_in.pl
和 p3_out.pl
。
由于 MISA 程序读取 fasta 文件中的序列 ID,将序列 ID 中的空格用下划线 ”_” 填补了,所以在fasta文件中,其序列ID最好不要有空格。否则运行接下来的程序时,会出问题。
Get_est_trimmer.pl
针对EST序列,可以除去EST序列中短的序列和两端不明确的碱基。
2.第二步:
p3_in.pl
输入 misa.pl 的输出结果,将引物设计的参数文件(模板,产物长度,目标区域等)导入到一个以“p3in”为后缀的文件中。
p3_in.pl filename.misa
3.第三步:
primer3主设计引物脚本
primer3_core -default_version=1 -output=filename.p3out filename.p3in
4.第四步:
p3_out.pl对primer3产生的文件进行提取合,得到最后的结果文件 filename.result
p3_out.pl filename.p3out filename.misa
tips: p3_in.pl 和 p3_out.pl 这两个程序可能需要修改才能正常使用。
参考:http://www.chenlianfu.com/?p=255
(19条消息) 使用Misa结合Primer3来批量设计SSR引物_misa安装_awk_bioinfo的博客-CSDN博客
网友评论