美文网首页
Linux下使用aspera下载EBI高通量数据

Linux下使用aspera下载EBI高通量数据

作者: Wei_Sun | 来源:发表于2021-11-29 16:43 被阅读0次

写在前面的话,不要用NCBI,不要用NCBI,不要用NCBI!!!重要的事情说三次!!!真的太垃圾了,气的我要爆炸,来回检查没错误就是下不了,换了EBI下载速度飞起,NCBI有的EBI基本都有,所以,放弃NCBI吧!

aspera的下载安装参考这篇文章:
安装Aspera Connect工具下载sra数据 - 简书 (jianshu.com)

下面进入下载的正题:
EBI官网:https://www.ebi.ac.uk/ena/browser/home


在EBI官网中搜索文章中的项目编号,BioProject后即为项目编号,以下图为例:

搜索结果如下,网页下拉可以看到这个project下所有的高通量数据信息:

右键测序数据文件,在新目标页中打开,得到下载地址:
ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR640/001/SRR6400061/SRR6400061_1.fastq.gz

1. 单文件下载

创建目录文件夹保存下载数据:

mkdir ~/wangjing/mut

前面命令都是一样的,只需要替换fasp.sra.ebi.ac.uk:/vol1后面的文件下载地址即可:

cd ~/.aspera/connect/bin
./ascp -k 1 -QT -l 300m -P33001 \
-i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh \
era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR640/001/SRR6400061/SRR6400061_1.fastq.gz ~/wangjing/mut

具体参数的意义可以通过./ascp -h查看帮助文档:


或者这篇文章中有介绍:
使用aspera下载.fastq.gz和.sra数据 - 简书 (jianshu.com)

2. 批量文件下载

方法1:while done循环




下载得到.txt,其中包含下载地址,找到fasp.sra.ebi.ac.uk:开头,整理为srr.list:

cat ~/wangjing/mut/srr.list | while read id 
do
./ascp -k 1 -QT -l 300m -P33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@$id ~/wangjing/mut/
done

方法2:--file-list参数

整理down.list,和上面的格式稍有不同:



自带的--file-list参数可以完成批量下载数据:

./ascp -k 1 -QT -l 300m -P33001 \
-i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh \
--user era-fasp --mode recv --host fasp.sra.ebi.ac.uk --file-list  ~/wangjing/mut/down.list ~/wangjing/mut/

引用转载请注明出处,如有错误敬请指出。

相关文章

网友评论

      本文标题:Linux下使用aspera下载EBI高通量数据

      本文链接:https://www.haomeiwen.com/subject/ohhgtrtx.html