美文网首页
数据库 | DDBJ:宏转录组测序数据下载

数据库 | DDBJ:宏转录组测序数据下载

作者: 胡童远 | 来源:发表于2021-05-08 15:55 被阅读0次

DDBJ数据库简介

DDBJ(DNA Data Bank of Japan)是与NCBI的GenBank,EMBL的EBI数据库齐名的世界三大DNA 数据库之一。DDBJ由日本研究机构于1983年建立。DDBJ数据库不仅已经收录了20多万个研究的600多万样本的测序数据,而且现在还保持每日更新。

DDBJ数据库地址: https://www.ddbj.nig.ac.jp/index-e.html

DDBJ数据库收录数据:
人、动物、植物、土壤、水体等样本的基因组、转录组、表观组、外显子组、宏基因组、宏转录组等多组学数据。

如何从DDBJ中获取宏转录组测序数据?

方法一:进入DDBJ寻找任意感兴趣的组学数据(不做介绍)。
方法二:根据文章中提供的DDBJ DRA编号进行数据检索和下载,过程如下:

第一步
在宏转录组相关研究的文章中的Data availability处找到metatranscriptome data的DDBJ DRA编号,例如:

第二步
打开DDBJ数据库,点击进入Sequence Read Archive (DRA)。

第三步
点击进入Search。

第四步
在Accession中输入DRA编号(例如:DRA006303),点击Search。

第五步
选择一个Run (如:DRR110568),点击进入该Run的FASTQ目录,右键鼠标复制DRR110568_1.fastq.bz2和DRR110568_2.fastq.bz2的下载链接。

第六步
在Linux环境中下载,解压fastq文件。

下载

wget -c ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA006/DRA006303/DRX103657/DRR110568_1.fastq.bz2 &
wget -c ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA006/DRA006303/DRX103657/DRR110568_2.fastq.bz2 &

解压

bzip2 -d DRR110568_1.fastq.bz2 &
bzip2 -d DRR110568_2.fastq.bz2 &

这样我们就获得了一个样本的宏转录组测序的fastq文件。

首次发布于微生太

相关文章

网友评论

      本文标题:数据库 | DDBJ:宏转录组测序数据下载

      本文链接:https://www.haomeiwen.com/subject/lgbudltx.html