写在前面的话,不要用NCBI,不要用NCBI,不要用NCBI!!!重要的事情说三次!!!真的太垃圾了,气的我要爆炸,来回检查没错误就是下不了,换了EBI下载速度飞起,NCBI有的EBI基本都有,所以,放弃NCBI吧!
aspera的下载安装参考这篇文章:
安装Aspera Connect工具下载sra数据 - 简书 (jianshu.com)
下面进入下载的正题:
EBI官网:https://www.ebi.ac.uk/ena/browser/home
在EBI官网中搜索文章中的项目编号,BioProject后即为项目编号,以下图为例:
搜索结果如下,网页下拉可以看到这个project下所有的高通量数据信息:
右键测序数据文件,在新目标页中打开,得到下载地址:
ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR640/001/SRR6400061/SRR6400061_1.fastq.gz
1. 单文件下载
创建目录文件夹保存下载数据:
mkdir ~/wangjing/mut
前面命令都是一样的,只需要替换fasp.sra.ebi.ac.uk:/vol1后面的文件下载地址即可:
cd ~/.aspera/connect/bin
./ascp -k 1 -QT -l 300m -P33001 \
-i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh \
era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR640/001/SRR6400061/SRR6400061_1.fastq.gz ~/wangjing/mut
具体参数的意义可以通过./ascp -h查看帮助文档:
或者这篇文章中有介绍:
使用aspera下载.fastq.gz和.sra数据 - 简书 (jianshu.com)
2. 批量文件下载
方法1:while done循环
下载得到.txt,其中包含下载地址,找到fasp.sra.ebi.ac.uk:开头,整理为srr.list:
cat ~/wangjing/mut/srr.list | while read id
do
./ascp -k 1 -QT -l 300m -P33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@$id ~/wangjing/mut/
done
方法2:--file-list参数
整理down.list,和上面的格式稍有不同:
自带的--file-list参数可以完成批量下载数据:
./ascp -k 1 -QT -l 300m -P33001 \
-i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh \
--user era-fasp --mode recv --host fasp.sra.ebi.ac.uk --file-list ~/wangjing/mut/down.list ~/wangjing/mut/
引用转载请注明出处,如有错误敬请指出。
网友评论