转录组数据上传教程(SRA)
为什么要上传
我们在投稿之前都要把数据上传才能发表。但是,数据上传如果不知道一些套路的话,会很麻烦。笔者曾经在博士期间被转录组数据上传弄得焦头烂额,直接被老板鄙视。
那么,转录组数据上传到底要怎么搞呢?
为了让大家不再走我的弯路,把上传的经验整理了一个教程。
上传数据全流程
上传的过程比较简单,不包括上传数据的时间,大概一个小时就搞定了。
注册帐号
上传之前首先要注册一个NCBI帐号。这个就不教了。
新建NCBI上传
- 在NCBI的首页点Submit image
- 然后选择上面的SRA,千万别选错了,选成下面的SRA会很麻烦很麻烦的(别问我是怎么知道的) image
- 然后点New submission image
完成认证
- 然后会提示你完成认证,至少有一个科研单位/大学的email image
完善信息
- 这两个都选NO,为了省事。 image
- 填写相关项目信息 image
- 然后选数据类型,这里我选的是plant sample image
- 接下来就是最关键的部分了:填写数据相关表格
-
填写Attributes
image
- 具体方法可以参考我的例子或NCBI的例子,从这里下载,密码为kt79。如果不确定可以先参考下面的图片试着填一下,但是一定要注意:拉丁名一定要写对,否则可能需要至少2天才能改过来(需要NCBI人工修改)。
- 我的最终版本如下: image
-
然后是完成metadata的表格填写
image
- 这一步可以参考我的最终版本(右键点开查看大图): image
-
填写Attributes
image
开始上传数据。
- 如果数据较多就选第一个,较少就用http网页上传就可以了: image
- 下面介绍如何用aspera批量上传大量数据。选中preload之后,会在下面出现相关的aspera命令和key。下载key到本地。 image
- 以mac系统为例:下载aspera image
- 安装aspera之后,输入以下代码,将aspera加入到环境变量,方便使用:
cd ~/Applications/Aspera\ Connect.app/Contents/Resources/
echo "alias ascp='$PWD/ascp'" >> ~/.bash_profile
source ~/.bash_profile
- 使用网页上给出的命令,上传数据(注意,-i后面是之前下载的key的绝对路径): image
- 上传速度还不错,大概5min能上传2G。上传完所有的数据之后等上10-15min,可以出现下面的选项: image
- 注意,如果少上传了数据,NCBI会提示你继续上传;但是如果上传多了,直接点下一步就可以了,NCBI会自动忽略多余的文件: image
完成上传:
- 上传完了之后,会给你一个Overview: image
- 大概半小时之后,NCBI会处理你的数据: image
上传之后
找NCBI要review link
- 一般,我们不会把数据上传之后立即release,所以在文章投稿的时候,需要一个review link,可以发邮件给sra@ncbi.nlm.nih.gov,告知其内容如下(仅供参考): image
- 大概1-2天之后,NCBI会给你回信: image
Changelog
- 作者:石勇
- 日期:20180510
- 观赏打赏: image
网友评论