前言
有很多软件都可以完成gff文件到genbank文件的转换,如脚本:https://github.com/chundruv/GFF-to-GenBank 但该脚本需要依赖BioPython和BCbio,安装起来较为麻烦,在这里不做推荐。
此处推荐使用更便捷的软件EMBOSS Seqret
一、GFF文件转换为Genbank文件
输入文件:gff3文件和fasta文件
1. 软件安装-EMBOSS
#conda安装 emboss
conda install -c bioconda emboss
2. 软件说明及运行
(base) [hty@master]$ seqret -h
Read and write (return) sequences
Version: EMBOSS:6.6.0.0
Standard (Mandatory) qualifiers:
[-sequence] seqall (Gapped) sequence(s) filename and optional
format, or reference (input USA)
[-outseq] seqoutall [<sequence>.<format>] Sequence set(s)
filename and optional format (output USA)
Additional (Optional) qualifiers: (none)
Advanced (Unprompted) qualifiers:
-feature boolean Use feature information
-firstonly boolean [N] Read one sequence and stop
General qualifiers:
-help boolean Report command line options and exit. More
information on associated and general
qualifiers can be found with -help -verbose
#运行命令
seqret -sequence Your.fasta -feature -fformat gff -fopenfile Your.gff3 -osformat genbank -osname_outseq Output_prefix -ofdirectory_outseq gbk_file -auto &
#-sequence Your.fasta 输入fasta文件
#-fopenfile Your.gff3 输入gff3文件
#-osname_outseq Output_prefix 输出文件前缀
二、Mauve进行多序列比对
使用Genbank文件进行多序列比对时,注意Mauve对Genbank文件格式的要求非常严格,Genbank文件后缀需要.gb结尾。
1. 打开Align with progressiveMauve模式
2. 选中需要进行比对的gb文件
【注意事项1】参考基因组需要放在首位。
【注意事项2】Output文件夹需要新建,保证文件夹中无任何文件。
【注意事项3】Output文件路径在新建的文件夹内,路径不能有中文,需要写输入文件前缀。
网友评论