写在前面
「育种」是目前大多关心的事情。杂交育种仍然是目前最为常用的育种手段。任何方法创新的优异材料,下一步都可能应用于杂交育种。反过来,「基因定位」则是基于杂交群体,开发分子标记,定位到关键性状的关联区间,并试图确定Casual Variants。两者都会涉及到两个亲本和他们的子代。当我们有两个亲本的基因组序列时,完全可以基于这两个序列,直接确定差异位点,进而相对有方向的设计引物,用于快速定位,更或者,鉴定杂种后代。相对于简单的单个物种基因组序列鉴定 SSR,随后设计引物。这一操作,显得更为高效且靠谱。
当然,事实上,这个需求黎老板早前也有与我提到,对应的,那么这个需求在「作物学」相关科研工作,必然是存在且重要。于是,有了今天这个插件「Genome VarScan」。
插件简介
「Genome VarScan」只需要用户输入两个基因组序列文件,设置一个输出目录,点击「Start」,等待即可。逻辑上,对于水稻,我这边只需要不到10分钟。
直接上示例
大概 10 分钟搞定。
输出文件如下
对于其中的
paf
文件,可以直接用 TBtools 的 Paf Viz
功能查看但是事实上,我会更关心下面这个文件
虽然比较大,但是信息比较全,默认输出是包括所有 SNP,考虑限制变异位点的宽度为大于0,也就是至少是1bp长度变化,那么就只有插入缺失。
可以看到这是一个大片段的缺失
当然,很多时候,我们最喜欢的还是大于30bp,但是又小于200bp的变异位点,那么我会建议,用这个
image.png
如此,我们会得到一个相对较小的文件。
当我们得到这个文件,那么其实接下来的事情就比较简单:
- 简单筛选一下,保留感兴趣的行
- 使用「Batch Target Region Primer Design」,使用参考基因组序列进行批量引物设计
- 使用「Primer Check」分别对两个物种进行批量引物筛选,找到材料内特异的位点
- 简单比较统一引物在不同材料中是否确实有长度差异
- 用于实验验证
- 用于选育种
大体如下,首先是批量引物设计
复制引物之后转换成 Fasta 格式,检测在一个材料中的特异性
可以同时检测在另一个材料中的特异性
一共是 5000对 引物左右,所以咱们就慢慢先等着结果。估计至少要等上一段时间吧。具体没测试。建议过夜培养。晚上没吃饭,刚才去吃了宵夜回来。没想到就过了12点。似乎还是跑了很久,必须过夜培养了。也罢,只选几个引物看看。
随便选两对引物,都可以直接用于跑标记....
写在最后
很多时候,你只需要知道自己在干什么就行。其他人常常只能看到他们能看到的东西,而你不一样。
网友评论