网上有各种下载SRA数据的方法,这些方法我也尝试过,但是总是出现各种问题和困难。
比如最常见的方法FTP下载ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/,不过经常发现wget获取文件失败,这是因为有些文件夹里面是缺少文件的。
再比如利用SRAToolkit、Aspera等工具下载,但是安装过程太麻烦,使用起来也困难。
这样一对比,直接利用SRA的上传地址获取数据的方法不仅简单,而且稳定。毕竟无论是哪一种下载SRA数据的方法,最终都要追溯到SRA的上传地址。
下面我以SRP000001为例,展示如何最直接有效地下载SRA数据
获取SRA的编号 SRP00001 后 → 在SRA数据库中 输入编号 SRP00001, 点击 search → 在结果页面中找到 Send to → 点击 File 文件,在 Format 选择 RunInfo → 点击 Create File, 这样你就获得了一个 SraRunInfo.csv文件 → 打开文件就可以看到 download_path 中的下载链接
可以直接在浏览器中输入下载链接后下载,就是下载速度非常慢;也可以选择在服务器中利用 wget + 链接 进行下载,如果你的文件名都是连续的还可以利用 wget+for循环进行下载。
![](https://img.haomeiwen.com/i15958709/ae1dab136096700e.png)
![](https://img.haomeiwen.com/i15958709/3bc8d4b9031e4d9e.png)
![](https://img.haomeiwen.com/i15958709/a5c7dfe0a28ba40f.png)
![](https://img.haomeiwen.com/i15958709/31206bf8744ca034.png)
网友评论