美文网首页生物信息软件生物信息生信
bioconvert:各种各样的生物信息数据格式转换工具

bioconvert:各种各样的生物信息数据格式转换工具

作者: 小明的数据分析笔记本 | 来源:发表于2021-08-04 11:30 被阅读0次

    今天找计算测序覆盖度的时候发现了这个工具,github 主页是https://github.com/bioconvert/bioconvert;帮助文档的链接是 https://bioconvert.readthedocs.io/en/master/

    关于各种各样的文件格式 可以参考下图

    image.png

    看帮助文档的时候还发现他可以直接下载测序数据

    下面我们尝试一下

    内容主要来自 https://bioconvert.readthedocs.io/en/master/tutorial.html

    首先是安装

    使用conda 先新建一个虚拟环境

    conda create -n bioconvert

    启动环境
    conda activate bioconvert

    安装

    conda install python==3.6

    pip install bioconvert

    这里遇到了报错,忘记截图了,我是把pandas安装了一下
    conda install pandas

    然后运行pip命令

    pip install bioconvert==0.4.3 -i https://pypi.tuna.tsinghua.edu.cn/simple

    这边应该是安装成功了

    查看帮助文档bioconvert --help

    报错

    查了一下是python版本需要大于3.6,我刚好安装的是3.6
    重新安装一下python

    将整个虚拟环境删除然后重新安装

    conda remove -n bioconvert --all
    

    重新安装

    conda create -n bioconvert python=3.7
    conda activate bioconvert
    pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple
    pip install bioconvert==0.4.3 -i https://pypi.tuna.tsinghua.edu.cn/simple
    

    这下没有报错,但是遇到了很多警告信息,暂时不管了

    试一下,NCBI下载了一个genbank文件,线板fasta格式的序列提取出来 https://www.ncbi.nlm.nih.gov/nuccore/FN433596

    bioconvert genbank2fasta staphylococcus_aureus.gb

    使用命令的时候会跳出来很多警告信息

    接下来又尝试了 from sources 的安装方法

    image.png

    这套命令运行下来 依然有一个警告信息,但是比之前少了很多

    image.png

    帮助文档里还提到了使用conda直接安装,但是我这边就一直没有成功,暂时不知道什么原因

    最后再试一下gb文件中提取fasta文件

    bioconvert genbank2fasta sequence.gb output.fasta

    image.png

    这次成功了 输出的HHH是哈哈哈哈的意思吗 哈哈哈哈

    欢迎大家关注我的公众号

    小明的数据分析笔记本

    小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!

    相关文章

      网友评论

        本文标题:bioconvert:各种各样的生物信息数据格式转换工具

        本文链接:https://www.haomeiwen.com/subject/bxzevltx.html