早先写过,但是有不少朋友还是在后台留言,无法完全重复。我仔细看了之后发现,的确是我在有些细节上写的不够详细。但是不想去完善了。毕竟tbtools的实现逻辑已经很简单了。
那就是IOS,即input,output,start。
最近又有读者在做物种间共线性,其实和物种内也没差。那今天就写一下物种间的共线性circos作图。
这篇推文不只是演示物种间的共线性,而是更进一步让大家体会使用tbtools时需要注意的问题。以便指导大家下次使用tbtools其他功能时能够具备自行解决和筛查可能出现的报错原因。
看到下图即可知道需要准备哪些文件。(这一步不要急着操作,往下看,看完再说)
第一步:准备物种1和物种2基因组序列文件和注释文件。
然后打开One Step MCScanX(这一步不要急着操作,往下看,看完再说)
start之后,通常会有黑框弹出。不用管,继续等待。
11:37开始运行。
中午电脑在运行,我就去吃饭了。晚上七点多过来一看卡死了。突然想起来早上的上一步出了点小状况。
好,及时纠正。突然想起来有个super fast的插件。打开One Step MCScanX-Super Fast,真的超快,super fast!!!
大约等待20min就finished。输出文件如下:
下面出图
然后,同样需要高亮一些我们需要展示的基因,我这里就从头取20个基因,用以展示。
到这里,两物种间的共线性就做好了。
下面我们接着看多物种间的共线性怎么做?
上面对拟南芥和小麦进行了共线性。由于我电脑上之前下载过马铃薯的,而且马铃薯基因组相对小很多。操作起来会快一点,所以我们就对马铃薯和拟南芥进行共线性。
同样。
如果弹出黑框,请忽略,基本不影响。
21:22start
21:24finished
输出文件如下:
下面我们来作图
看到这个界面,就知道我们需要准备哪几个文件。
好,那就合并这几个文件。然后出图。
显然,肯定会报错。刚才两两比对的输出文件肯定没有错。那问题出在哪里呢?由于我们在操作之前没有对3个物种的染色体ID进行重命名。由于拟南芥和马铃薯的染色体都是以数字1、2、3……进行命名的,因此在后续分析和作图过程中肯定会报错。
----------------------------强制分割线-------------------------------------
【下面正式进入多物种间共线性】
更多内容请关注微信公众号:今日之森。
第一步:数据准备
好,那就重新来过,对染色体ID进行统一。
然后准备出图,这里需要对两次各自比对的文件进行合并整理。具体看个人了,这里不进行演示。有需要的后台私信。
出图如下:(这里只选取了前拟南芥前100个基因进行高亮显示)
大致就是如此。但仔细一看,除了拟南芥染色体是按顺序排列的,St和Ta的染色体是乱序的。这就需要简单调整一下了。
这样看起来就好多了。
当然对于这个图还有很多地方可以调整。
网友评论