bioconvert：各种各样的生物信息数据格式转换工具

作者: 小明的数据分析笔记本 | 来源:发表于2021-08-04 11:30 被阅读0次

bioconvert：各种各样的生物信息数据格式转换工具
Bioconvert(interconversion of bi
生物数据格式转换：bedtools or bedops
生物信息常见数据格式
生物信息分析常用文件格式和软件
基于js的数组转换为二叉树object
数据解析利器「正则表达式」
网络基础
ES6学习笔记（七）：数组的扩展
生物信息学常见数据格式

今天找计算测序覆盖度的时候发现了这个工具，github 主页是https://github.com/bioconvert/bioconvert；帮助文档的链接是 https://bioconvert.readthedocs.io/en/master/

关于各种各样的文件格式可以参考下图

image.png

看帮助文档的时候还发现他可以直接下载测序数据

下面我们尝试一下

内容主要来自 https://bioconvert.readthedocs.io/en/master/tutorial.html

首先是安装

使用conda 先新建一个虚拟环境

conda create -n bioconvert

启动环境
conda activate bioconvert

安装

conda install python==3.6

pip install bioconvert

这里遇到了报错，忘记截图了，我是把pandas安装了一下
conda install pandas

然后运行pip命令

pip install bioconvert==0.4.3 -i https://pypi.tuna.tsinghua.edu.cn/simple

这边应该是安装成功了

查看帮助文档bioconvert --help

报错

查了一下是python版本需要大于3.6，我刚好安装的是3.6
重新安装一下python

将整个虚拟环境删除然后重新安装

conda remove -n bioconvert --all

重新安装

conda create -n bioconvert python=3.7
conda activate bioconvert
pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install bioconvert==0.4.3 -i https://pypi.tuna.tsinghua.edu.cn/simple

这下没有报错，但是遇到了很多警告信息，暂时不管了

试一下，NCBI下载了一个genbank文件，线板fasta格式的序列提取出来 https://www.ncbi.nlm.nih.gov/nuccore/FN433596

bioconvert genbank2fasta staphylococcus_aureus.gb

使用命令的时候会跳出来很多警告信息

接下来又尝试了 from sources 的安装方法

image.png

这套命令运行下来依然有一个警告信息，但是比之前少了很多

image.png

帮助文档里还提到了使用conda直接安装，但是我这边就一直没有成功，暂时不知道什么原因

最后再试一下gb文件中提取fasta文件

bioconvert genbank2fasta sequence.gb output.fasta

image.png

这次成功了输出的HHH是哈哈哈哈的意思吗哈哈哈哈

欢迎大家关注我的公众号

小明的数据分析笔记本

小明的数据分析笔记本公众号主要分享：1、R语言和python做数据分析和数据可视化的简单小例子；2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记；3、生物信息学入门学习资料及自己的学习笔记！

网友评论

本文标题：bioconvert：各种各样的生物信息数据格式转换工具

本文链接：https://www.haomeiwen.com/subject/bxzevltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

bioconvert：各种各样的生物信息数据格式转换工具

下面我们尝试一下

首先是安装

相关文章