安装时间:2021.2.19
1. 简介
ncbi-genome-download是一个可以直接从NCBI上批量下载序列的软件,支持下载多种格式。
2. 安装
利用conda
安装即可
conda install -c bioconda ncbi-genome-download
3. 重要参数说明
-
-s
:选择数据库(genbank,refseq),默认是refseq数据库 -
-F
:需要下载基因组的格式,可以多种格式同时下载,用逗号隔开,默认是genbank格式 -
-l
:序列组装程度,可以多种格式同时下载,用逗号隔开 -
-g
:需要下载序列的属,后面要指定类群,比如bacteria -
S
:下载的具体的菌种名称,用逗号隔开,也可以写入一个文件中,一行一个菌种名称 -
-o
:输出的文件名称 -
-r
:失败时重新连接的次数,默认是0次 -
--flat-output
:将下载的文件输入到一个目录中,不创建新的子文件
4. 实例
- 下载青枯菌(Ralstonia solanacearum)中全部完整和染色体的基因组,模式的下载格式为genbank,下载的全部文件存放在目录“R.solanacearum”中
ncbi-genome-download -g "Ralstonia solanacearum" bacteria -l "complete,chromosome" --flat-output -o R.solanacearum
- 下载假单胞菌属(Pseudomonas)中所有的基因组序列
ncbi-genome-download -g "Pseudomonas" bacteria -l "complete,chromosome" --flat-output -o Pseudomonas
- 通过NCBI中的Taxonomy ID下载单个或多个菌株基因组
ncbi-genome-download --taxids 386585 bacteria -F protein-fasta --flat-output -o Escherichia_coli_O157:H7 Sakai
菌株的Taxonomy ID可以通过NCBI的数据库得到:Taxonomy
网友评论