美文网首页
EDTA注释重复序列之安装篇

EDTA注释重复序列之安装篇

作者: 小明的数据分析笔记本 | 来源:发表于2023-02-18 10:14 被阅读0次

    github主页

    https://github.com/oushujun/EDTA

    按照主页的帮助文档 我用conda安装

    conda env create -f EDTA.yml
    

    可能是网络的问题 一直没有成功

    用网络稍微好一点的服务器,运行

    conda env create -f EDTA.yml
    

    这个成功了

    然后把这个环境打包下来

    conda install conda-pack -y 
    conda pack -n EDTA -o EDTA.tar.gz
    

    然后把打包好的文件下载下来,放到我分析数据的服务器上

    mkdir EDTA
    tar -xzf EDTA.tar.gz -C EDTA
    

    然后把github主页的软件包下载下来

    启动这个EDTA的环境

    source EDTA/bin/activate
    

    然后运行命令

    perl ~/biotools/EDTA/EDTA.pl -genome at_chr1.fa -species others -step all -t 8
    

    遇到报错

    Fri Feb 17 09:58:03 CST 2023    Dependency checking:
    Error: The RMblast engine is not installed in RepeatMasker!
    

    查了一下这个报错,找到

    https://github.com/oushujun/EDTA/issues/11

    image.png

    可以指定repeatmasker的路径

    我之前用conda安装过repeatmasker

    试一下命令

    EDTA.pl -genome at_chr1.fa -species others -step all -t 8 --repeatmasker /home/myan/anaconda3/envs/repeat/bin/RepeatMasker
    

    这个也不行,还是有报错,忘记截图了,

    猜测是打包的conda环境有关,一直提示的就是在某个路径下找不到某个脚本,而且那个路径很奇怪,我搜索了一下这个报错也没有找到对应的解决办法

    github主页还介绍了使用mamba安装的方法,我再试这个方法

    首先是运行这个命令

    mamba install -c conda-forge -c bioconda edta python=3.6 tensorflow=1.14 'h5py<3'
    

    有报错,但是报错忘记截图了

    然后我把 -c参数的内容去掉 (为啥去掉这个参数 我也说不清楚,就是瞎试)

    mamba install edta python=3.6 tensorflow=1.14 'h5py<3'
    

    还是报错,而且这一步卡了很长时间,具体多长时间我也不知道,报错信息是

    Could not solve for environment specs
    Encountered problems while solving:
      - nothing provides libmamba 0.23.1 h1566912_0 needed by libmambapy-0.23.1-py310hd09550d_0
    
    The environment can't be solved, aborting the operation
    

    猜测是python版本的问题,因为python3.6,有点老了

    单独安装python3.6试试

    mamba install python=3.6
    

    和上面的报错一样

    把python改成3.7试试

    mamba install python=3.7
    

    幸运这次没有报错了,然后再安装另外一个依赖

    mamba install tensorflow=1.14 'h5py<3'
    

    幸运没有报错

    最后安装edta

    mamba install edta -y
    

    没有报错

    使用

    EDTA.pl -genome at_chr1.fa -species others -step all -t 8
    

    这个好像成功了

    运行完中间有个提示信息

    Use of uninitialized value $seq_new in substr at /home/myan/anaconda3/envs/EDTA/share/EDTA/util/cleanup_nested.pl line 190.
    Thread 1 terminated abnormally: substr outside of string at /home/myan/anaconda3/envs/EDTA/share/EDTA/util/cleanup_nested.pl line 190
    

    不知道有没有影响

    结果怎么看还得研究

    前后折腾了好几天

    相关文章

      网友评论

          本文标题:EDTA注释重复序列之安装篇

          本文链接:https://www.haomeiwen.com/subject/yclpkdtx.html