EnsemblePlants植物基因组数据库有直接的FTP服务器
本教程教你如何使用著名的lftp包下载这一大型数据库
第一步,安装lftp相关包
sudo apt-get install lftp #安装lftp
第二步,运行lftp
sudo lftp #运行lftp
第三步,设置本地目录
lcd /home/bohan/ensembleplantsgenome #设置本地目录
第四步,登录服务器
lftp ftp://ftp.ensemblgenomes.org/pub/plants/release-44/fasta/ #通过匿名方式登录服务器
第五步,将服务器目录镜像下载至本地
mirror -c -e -n --parallel=20 ftp://ftp.ensemblgenomes.org/pub/plants/release-44/fasta/ /home/bohan/ensembleplantsgenome #同时使用20个线程同步下载相应目录至本地
运行成功后,可以通过jobs命令查看当前运行的下载任务
jobs -v #查看目前进行任务
也可以直接按ctrl+c退出转入nohup模式继续
也可以在退出后当前终端linux控制台
使用jobs和bg命令将当前进程转入后台
jobs #显示当前终端运行的任务
[1] mirror -c -e -n --parallel=20 ftp://ftp.ensemblgenomes.org/pub/plants/release-44/fasta/ /home/bohan/ensembleplantsgenome
bg %1 #将jobs命令显示出的1号任务转为后台
mirror 命令参数
-c, --continue 支持断点续传if possible
-e, --delete 如果远程目录下已经没有某个文件,而本地有,则删除这个文件。
--delete-first 在下载新文件之前先删除旧的文件
-s, --allow-suid 保留远程目录中设定的用户及组权限
--allow-chown 设置下载文件的所有者和所属组
--ignore-time 屏蔽时间判定,这样mirror只通过大小来判断文件,同步速度可以加快。
-n, --only-newer 只下载新的文件,mirror的判定新文件是通过文件大小和修改时间来判定的(这时候-c不能使用)
-r, --no-recursion 不下载子目录中的文件,即没有递归的功能
-p, --no-perms 不设置下载后文件的访问权限
--no-umask don't apply umask to file modes #这个不知道怎么翻译
-R, --reverse 上传到FTP
-L, --dereference download symbolic links as files #这个不知道怎么翻译
-N, --newer-than=SPEC 只下载某个特定时间以后更新过的文件
-P, --parallel[=N] 同时下载N个文件
-i RX, --include RX 下载时包含的文件名称,RX表示正则表达式
-x RX, --exclude RX 下载时不包含的文件名称,RX表示正则表达式
-v, --verbose[=N] 关于操作的详细输出。
--log=FILE 将已经执行过的lftp命令写入文件
--script=FILE 将lftp命令写入文件,但不执行
网友评论