美文网首页
比较基因组(1) - Cactus多基因组比对 - 未完待续

比较基因组(1) - Cactus多基因组比对 - 未完待续

作者: 深山夕照深秋雨OvO | 来源:发表于2023-01-23 00:23 被阅读0次

    0.安装
    Github: https://github.com/ComparativeGenomicsToolkit/cactus

    git clone https://github.com/ComparativeGenomicsToolkit/cactus.git --recursive
    
    #创建Python虚拟环境。首先安装virtualenv,如果需要使用python3 -m pip Install virtualenv
    cd cactus
    virtualenv -p python3 cactus_env
    echo "export PATH=$(pwd)/bin:\$PATH" >> cactus_env/bin/activate
    echo "export PYTHONPATH=$(pwd)/lib:\$PYTHONPATH" >> cactus_env/bin/activate
    source cactus_env/bin/activate
    python3 -m pip install -U setuptools pip
    python3 -m pip install -U -r ./toil-requirement.txt
    python3 -m pip install -U .
    
    #以后使用的时候,激活python虚拟环境即可
    source ./cactus-bin-v2.2.4/cactus_env/bin/activate
    

    1.输入文件
    安装目录中有一个示例文件: cactus/examples/evolverMammals.txt
    cactus ./js ./examples/evolverMammals.txt ./evolverMammals.hal
    运行示例文件,检查是否安装成功

    可以看到Cactus要求两个输入文件,第一个是nwk格式的进化树,可以参考https://www.jianshu.com/p/dd1f46aaae8b,或者用orthonfinder等等
    第二个是基因组序列, 最后把树和基因组路径放到一个txt里面即可

    示例文件内容, 把网站换成路径即可
    cactus 输出文件夹 input.txt out.hal
    #sed -i 's/\.//g' spp1.fa  #在处理一些基因组的时候会报错, 检测到我的序列中含有.  最后用sed解决
    
    cactus-hal2maf 输出文件夹2 ./out.hal out.maf.gz --refGenome ref.fa --chunkSize 1000000 #--noAncestors --onlyOrthologs, 可以转为maf,后面两个参数是加速输出但是降低复杂度
    

    未完待续....

    相关文章

      网友评论

          本文标题:比较基因组(1) - Cactus多基因组比对 - 未完待续

          本文链接:https://www.haomeiwen.com/subject/oahqhdtx.html