0.安装
Github: https://github.com/ComparativeGenomicsToolkit/cactus
git clone https://github.com/ComparativeGenomicsToolkit/cactus.git --recursive
#创建Python虚拟环境。首先安装virtualenv,如果需要使用python3 -m pip Install virtualenv
cd cactus
virtualenv -p python3 cactus_env
echo "export PATH=$(pwd)/bin:\$PATH" >> cactus_env/bin/activate
echo "export PYTHONPATH=$(pwd)/lib:\$PYTHONPATH" >> cactus_env/bin/activate
source cactus_env/bin/activate
python3 -m pip install -U setuptools pip
python3 -m pip install -U -r ./toil-requirement.txt
python3 -m pip install -U .
#以后使用的时候,激活python虚拟环境即可
source ./cactus-bin-v2.2.4/cactus_env/bin/activate
1.输入文件
安装目录中有一个示例文件: cactus/examples/evolverMammals.txt
cactus ./js ./examples/evolverMammals.txt ./evolverMammals.hal
运行示例文件,检查是否安装成功
可以看到Cactus要求两个输入文件,第一个是nwk格式的进化树,可以参考https://www.jianshu.com/p/dd1f46aaae8b,或者用orthonfinder等等
示例文件内容, 把网站换成路径即可
第二个是基因组序列, 最后把树和基因组路径放到一个txt里面即可
cactus 输出文件夹 input.txt out.hal
#sed -i 's/\.//g' spp1.fa #在处理一些基因组的时候会报错, 检测到我的序列中含有. 最后用sed解决
cactus-hal2maf 输出文件夹2 ./out.hal out.maf.gz --refGenome ref.fa --chunkSize 1000000 #--noAncestors --onlyOrthologs, 可以转为maf,后面两个参数是加速输出但是降低复杂度
未完待续....
网友评论