近期在NCBI SRA中下载的FastQ数据不再提供质量值信息(图1和图2),据说是为了后期便于敛财收费提供质量值,鄙人对这种万恶的资本主义行径大为不齿,NCBI这是自绝于世界人民之举,FastQ中没有质量值将严重影响reads组装等分析,从而严重影响科研进程,拖慢了医疗、工业等领域的发展。
图2 NCBI下载的FastQ数据质量信息全部变成30
好在,经研究测试,可使用替代方案从EBI数据库下载有质量值的FastQ数据。替代方案的具体操作步骤如下:
- 进入EBI数据库,搜索目标SRA数据。
- 获取数据下载链接,例如,vol1/fastq/SRR203/072/SRR20318972/SRR20318972_1.fastq.gz和vol1/fastq/SRR203/072/SRR20318972/SRR20318972_2.fastq.gz
- 采用ascp下载:
ascp -QT -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -l 300M -P 33001 -k 1 -T era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR203/067/SRR20318967/SRR20318967_1.fastq.gz .
ascp -QT -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -l 300M -P 33001 -k 1 -T era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR203/067/SRR20318967/SRR20318967_2.fastq.gz .
下载完毕后即可获得有质量值的SRA FastQ文件。
其中ascp相关软件的配置方法详见应用Aspera高速下载NCBI和EBI数据 - 简书 (jianshu.com)。
布莱特杨
2023年1月16日编辑
2023年5月31日 15:02发布
网友评论