美文网首页
NCBI数据上传(二):转录组测序(RNA-Seq)数据

NCBI数据上传(二):转录组测序(RNA-Seq)数据

作者: 百易汇能 | 来源:发表于2022-12-05 08:35 被阅读0次

    继“16S扩增子原始数据上传”教程发布之后,为满足大家对转录组数据上传的需求,小编马不停蹄地把转录组原始数据上传流程进行了整理,有需求地赶紧收藏吧!

    1  注册及登录账号

    1)注册账号:进入National Center for Biotechnology Information,找到页面右上角Sign in ,进入页面后,点击页面中的Sign up,根据自己喜好,选择对应的账号进行注册,按照提示填写账号、密码、邮箱等信息。

    https://www.ncbi.nlm.nih.gov/

    2)登录账号:输入账号及密码(注册时使用哪种账号注册,登录时选择对应的登录通道登录),点击Log in,然后点击左上角的NCBI大图标回到NCBI的主页,点击图中Submit按钮进入提交数据页面。

    2  生成Biosample编号

    1)进入Submit界面之后,选择My submissions。(提交数据前必须先把样品信息录入生成Biosample编号)

    2)在下一个界面中选择BioSample,进入新的页面,点击蓝色按钮New submission,。

    3)进入如下页面,根据实际情况填写提交者的信息:包括姓名,邮箱(需要填写一个以单位后缀邮箱),学校学院,单位地址,填写完成点击Continue。

    4)接下来填写数据释放的时间,可选择立即释放,也可选择指定日期;下一个选项选择batch/Multiple Biosamples,然后点击Continue即可。

    5)接下来选择样品类型Sample Type,通常的转录组样品选择比较多:原核转录组可选前两个,真核的根据样品可以选择:Pathogen affecting public health, Model organism or animal sample, Plant sample等等。然后点击最下方的Continue。

    6)接下来填写样品信息Attributes,在线填写和上传excel文件都可,小编习惯下载他们的模板填写后上传的方式:点击第二个选项,然后Download Excel。

    7)打开该Excel,文件如下,以本次提交的3个样品为例,其中绿色的栏目为必填项,如果不知道具体信息就填写“not collected”,填的越详细NCBI审核的速度会越快,如果都填“not collected”也可以,不过NCBI反馈给你Biosample编号会慢一些,大约需要2-3天,样品名称建议使用唯一的名称。上传之后就可以点击Continue进入下一个关卡了。

    8)接下来就是生成BioSample的最后一步,确认信息后点Submit即可。

    9)最后就是坐等NCBI的邮件,第一封邮件是点击Submit后自动发送的,可以忽略。我们需要等的邮件是包含Biosample编号的邮件,如下图所示。这封邮件里会详细说明您的每个样品跟Biosample accession号的对应关系,后续上传raw data需要用到。

    10)Bioproject编号申请与BioSample编号申请步骤一致,在以下页面点击Bioproject,按照提示填写相关信息即可。

    3  raw data上传

    1)待收到BioSample编号之后,我们要再次登录NCBI,进入Submit界面,这次我们选择Sequence Read Archive(SRA),然后点击New submission进入最后的数据上传关卡。

    2)填写个人信息。

    3)第二步填写通用信息,如果提前注册好了Bioproject号。Biosample这里选择yes,Release date根据需要选择即可。点击Continue。

    4) 接下来,根据实际项目内容填写项目的摘要,简单的几个词描述一下就可以了。后边的几个选项没有特殊情况的话第一个选择No,其他的不填即可。然后Continue。

    5)跟Biosample差不多,也需要填写一个表格,在线填写和下载模板填写再上传一样的,小编以下载Excel表格填写为例。

    6)这个表格是这个样子的:biosample accession编号就是邮件里的编号,library_ID这里可以自行命名只要不重复即可。剩下的选项如图所示,通常情况是这样填写,在filename那里,请各位同学一定要保证跟后续要上传的文件名完全一致,并且不能有“,”、“-”等奇奇怪怪的符号,如果有可以改成下划线“_”或者删掉。转录组的数据选项依次是:library strategy: RNA-seq; library source: Transcriptome; library selection; layout: paired。(至于后边的测序仪型号什么的可以咨询给您做项目的销售)。

    7)接下来就是最后一步了,上传数据。在这里,我们可以安装一个IBM的软件——Aspera Connect用于大数据传输(下载地址:https://downloads.asperasoft.com/en/downloads/8?list,下载安装即可,推荐使用360浏览器,与Aspera关联比较方便。

    8)选择图中第一个选项,在choose files选择你的所有文件,网站会自动使用Aspera帮您上传文件,速度很快。出现下图的界面就说明正在上传中了。

    9)数据上传完后,点击Continue即可。最后一步,核查相关信息,无问题后,点击提交,等待NCBI审核。审核通过后会收到相关邮件。

    4

    友情提示

    转录组测序的raw data通常较大,如果样品个数少的话可以通过第一个选项Web browser upload via HTTP or Aspera Connect plugin。如果是10个样品以上,推荐用第二个选项Aspera命令行上传(当然用第一个选项上传也是可以的,不过需要一定的耐心)。

                                                                                                                END

    百易汇能生物——提供专业、高效的高通量测序及多组学分析服务

    百易汇能生物引进了高通量测序平台、10x单细胞平台、质谱平台以及华为超算平台。

    专注于高通量测序技术在医学健康和生命科学领域的应用,提供国内领先的基因及多组学测序服务。

    咨询电话:027-63497508

    邮箱:market@bioyigene.com

    网址:http://bioyigene.com/

    公司地址:武汉东湖新技术开发区高新大道888号高农生物园总部B区20栋5层

    武汉百易汇能生物科技有限公司坐落于武汉光谷高农生物园总部,是一家专注于第二代、第三代测序技术在人类健康和生命科学研究两大领域应用的高新技术企业。公司现有软件著作60余项,发明专利6项;公司成立以来累计参与发表文章170余篇,其中包括Cell,Nature Genetics,PNAS,Food Chemistry等各领域顶级期刊。

    相关文章

      网友评论

          本文标题:NCBI数据上传(二):转录组测序(RNA-Seq)数据

          本文链接:https://www.haomeiwen.com/subject/yidvfdtx.html