美文网首页
下载GSA数据

下载GSA数据

作者: 大海龟啦啦啦 | 来源:发表于2021-08-31 21:03 被阅读0次

最近需要下载一批重测序数据,其上传到了GSA数据库,因此需要到GSA数据库进行查询和下载。GSA(Genome Sequence Archive)是2015年底,中科院北京基因组研究所生命与健康大数据中心开发的原始组学数据归档库。数据模型和数据格式遵照INSDC标准,在功能上等同于NCBI的SRA,EBI的ENA和DDBJ的DRA。
接下来是下载数据的流程:

首先是获取CRA号

即去到GSA网站检索,链接如下
https://ngdc.cncb.ac.cn/gsa/

GSA.jpg
如上图,得到相应的CRA号之后就是愉快的下载时间了。

在Linux服务器下载

一般是使用FTP来下载,相应的FTP路径则是ftp://download.big.ac.cn/gsa/CRA
我们可以在Linux服务器进行批量下载

wget -c -r -np -k -L -p  ftp://download.big.ac.cn/gsa/CRA000004/

参数详解如下 :
-c 断点续传
-r 递归下载,即下载指定网页某一目录下(包括子目录)的所有文件
-np 递归下载时不搜索上层目录,一定要加上这个参数,不然会下载太多东西的)
-k 将绝对链接转为相对链接,下载整个站点后脱机浏览网页,一般会加上这个参数
-L 递归时不进入其它主机

相关文章

网友评论

      本文标题:下载GSA数据

      本文链接:https://www.haomeiwen.com/subject/kafqultx.html