转录组数据上传到SRA

作者: 石博士 | 来源:发表于2018-05-10 17:59 被阅读1316次

    转录组数据上传教程(SRA)

    为什么要上传

    我们在投稿之前都要把数据上传才能发表。但是,数据上传如果不知道一些套路的话,会很麻烦。笔者曾经在博士期间被转录组数据上传弄得焦头烂额,直接被老板鄙视。
    那么,转录组数据上传到底要怎么搞呢?
    为了让大家不再走我的弯路,把上传的经验整理了一个教程。

    上传数据全流程

    上传的过程比较简单,不包括上传数据的时间,大概一个小时就搞定了。

    注册帐号

    上传之前首先要注册一个NCBI帐号。这个就不教了。

    新建NCBI上传

    • 在NCBI的首页点Submit image
    • 然后选择上面的SRA,千万别选错了,选成下面的SRA会很麻烦很麻烦的(别问我是怎么知道的) image
    • 然后点New submission image

    完成认证

    • 然后会提示你完成认证,至少有一个科研单位/大学的email image

    完善信息

    • 这两个都选NO,为了省事。 image
    • 填写相关项目信息 image
    • 然后选数据类型,这里我选的是plant sample image
    • 接下来就是最关键的部分了:填写数据相关表格
      • 填写Attributes image
        • 具体方法可以参考我的例子或NCBI的例子,从这里下载,密码为kt79。如果不确定可以先参考下面的图片试着填一下,但是一定要注意:拉丁名一定要写对,否则可能需要至少2天才能改过来(需要NCBI人工修改)。
        • 我的最终版本如下: image
      • 然后是完成metadata的表格填写 image
        • 这一步可以参考我的最终版本(右键点开查看大图): image

    开始上传数据。

    • 如果数据较多就选第一个,较少就用http网页上传就可以了: image
    • 下面介绍如何用aspera批量上传大量数据。选中preload之后,会在下面出现相关的aspera命令和key。下载key到本地。 image
    • 以mac系统为例:下载aspera image
    • 安装aspera之后,输入以下代码,将aspera加入到环境变量,方便使用:
    cd ~/Applications/Aspera\ Connect.app/Contents/Resources/
    echo "alias ascp='$PWD/ascp'" >> ~/.bash_profile
    source ~/.bash_profile
    
    • 使用网页上给出的命令,上传数据(注意,-i后面是之前下载的key的绝对路径): image
    • 上传速度还不错,大概5min能上传2G。上传完所有的数据之后等上10-15min,可以出现下面的选项: image
    • 注意,如果少上传了数据,NCBI会提示你继续上传;但是如果上传多了,直接点下一步就可以了,NCBI会自动忽略多余的文件: image

    完成上传:

    • 上传完了之后,会给你一个Overview: image
    • 大概半小时之后,NCBI会处理你的数据: image

    上传之后

    找NCBI要review link

    • 一般,我们不会把数据上传之后立即release,所以在文章投稿的时候,需要一个review link,可以发邮件给sra@ncbi.nlm.nih.gov,告知其内容如下(仅供参考): image
    • 大概1-2天之后,NCBI会给你回信: image

    Changelog

    • 作者:石勇
    • 日期:20180510
    • 观赏打赏: image

    相关文章

      网友评论

        本文标题:转录组数据上传到SRA

        本文链接:https://www.haomeiwen.com/subject/kadtdftx.html