美文网首页生信基因家族分析基因进化
用TBtools做物种内共线性分析(仅步骤)

用TBtools做物种内共线性分析(仅步骤)

作者: Devin561 | 来源:发表于2020-05-09 22:02 被阅读0次

    主要是参考https://www.tinymind.net.cn/articles/64d36abc7fd091

    首先我们拿到的是以下的材料


    搜狗截图20200509201150.png

    1. Blast比对

    根据以下选择blast


    blast_1.png

    然后将豌豆的fasta文件自己和自己比对(一般Hits数最少选择5个)


    blast_2.png

    这个时间比较长,我电脑大概用了一个晚上
    得到了以下文件,命名是自己命的,(额...豌豆的简写应该是Ps的,我最开始写的Pi,这个问题不大哈哈)


    blast_3.png

    2. 获得基因的位置信息

    在搜索栏查找,然后点Text merge for MCScanx


    MCScan_1.png

    将blast结果简化


    MCScan_2.png 得到Pisum_sativum.sim.gff文件

    3. 进行自我比对

    将tab文件和sim.gff文件放入quick run MCScanX Wrapper,设置好保存结果路径

    MCScan_3.png
    得到的结果如下
    MCScan_4.png
    其中tandem用excel打开,电脑原因目前打不开了,如果打开,进行分列
    方法参考https://baijiahao.baidu.com/s?id=1623642728105642204&wfr=spider&for=pc
    选择根据步骤逗号处打钩
    然后将第一列另存为存为txt格式
    如下图
    geneIDtext.png
    获得基因间关系的link文件,用Text merge for MCScanX
    links_1.png

    同理,将link文件用excel打开进行分列,然后直接另存为txt
    如图


    links_2.png

    4. 可视化

    基因组已经组装到染色体的,就不需要分析scaffold了,所以把原始gff文件scaffold的行删除掉,只留下染色体,然后另存为Pisum_sativum_v1a_genes_del_scaffolfd.gff3(文件名)


    gff_1.png

    用circle gene view进行可视化


    view.png

    然后就会得到以下的图


    view2.png
    调整调整参数 颜色,得到以下图像
    view3.png

    ...

    大致的步骤就是这样,但是我们要看特定基因的共线性,那么只需要将circle gene view中的set input gene ID list改改成特定的gene文本就行

    但是我们得到的gene list是这样的,这个gene list就是要看这些特定基因的共线性


    gene1.png

    但是links文件中是这样的


    gene2.png
    所以要处理以下gene的ID,将.1 .2等删掉,并且只留一个,如Psat1g090040.1和Psat1g090040.3,变成Psat1g090040,并且只留一个Psat1g090040
    后续处理就不在此做了

    ...
    结束

    相关文章

      网友评论

        本文标题:用TBtools做物种内共线性分析(仅步骤)

        本文链接:https://www.haomeiwen.com/subject/xyulnhtx.html