本篇文章把上传数据(扩增子测序)的步骤尽可能详细的整理出来,希望能对各位科研工作者有所帮助。其它类型数据上传讲解将依次在后续推文中奉上,大家持续关注哦!
1.注册及登录账号
1)注册一个NCBI(https://www.ncbi.nlm.nih.gov/)网页:按照提示填写账号、密码、邮箱等信息。
2)登录账号,点击左上角的NCBI大图标回到NCBI的主页,然后点击图中Submit按钮进入提交数据页面。
2.生成Biosample编号
1)进入Submit界面之后点击Make a selection的小三角,选择Biosample,点击GO。(提交数据前必须先把样品信息录入生成Biosample编号。
2)在下一个界面中点击蓝色按钮New submission。
3)进入如下页面,根据实际情况填写提交者的信息:包括姓名,邮箱(需要填写一个以单位后缀邮箱),学校学院,单位地址,填写完成点击Continue。
4)接下来填写数据释放的时间,可选择立即释放,也可选择指定日期;下一个选项选择batch/Multiple Biosamples,然后点击Continue即可。
5)接下来选择样品类型Sample Type,通常的微生物多样性样品选择第四个选项Metagenome or environmental sample,特殊的样品类型也可根据实际情况选择。然后点击最下方的Continue。
6)接下来填写样品信息Attributes,在线填写和上传excel文件都可,小编习惯下载他们的模板填写后上传的方式:点击第二个选项,然后Download Excel。
7)打开该Excel,文件如下,以本次提交的3个样品为例,其中绿色的栏目为必填项,如果不知道具体信息就填写“not collected”,填的越详细NCBI审核的速度会越快,如果都填“not collected”也可以,不过NCBI反馈给你Biosample编号会慢一些,大约需要2-3天。
8)上传之后就可以点击Continue进入下一个关卡了。值得注意的是,很多同学在点击Continue后会报错,网站提示有重复样品名称(但实际上表格里没有重复),这时候您需要在之前的excel表的最后一列再加一列replication,赋予每个样品不同的重复值即可,然后再次上传即可进入下一步。
9)接下来就是生成BioSample的最后一步,确认信息后点Submit即可。
10)接下来要做的就是坐等NCBI的邮件,第一封邮件是点击Submit后自动发送的,可以忽略。我们需要等的邮件是包含Biosample编号的邮件,如下图所示。这封邮件里会详细说明您的每个样品跟Biosample accession号的对应关系,后续上传raw data需要用到。
3.raw data上传
1)待收到BioSample编号之后,我们要再次登录NCBI,进入Submit界面,这次我们选择Sequence Read Archive(SRA),然后点击New submission进入最后的数据上传关卡。
2)同样的,第一步填写个人信息。
3)填写通用信息,这里我们没有注册Bioproject号,所以选择No(也可以单独申请Bioproject编号,小编认为那样操作有点繁琐)。Biosample这里要选择yes,Release date根据需要选择即可。点击Continue。
4) 接下来到了Bioproject阶段,根据实际项目内容填写项目的摘要,简单的几个词描述一下就可以了。后边的几个选项没有特殊情况的话第一个选择No,其他的不填即可。然后Continue。
5)跟Biosample差不多,也需要填写一个表格,在线填写和下载模板填写再上传一样的,小编以下载Excel表格填写为例。
6)这个表格是这个样子的:biosample accession编号就是邮件里的编号,library_ID这里可以自行命名只要不重复即可。剩下的选项如图所示,通常情况是这样填写,在filename那里,请各位同学一定要保证跟后续要上传的文件名完全一致,并且不能有“,”、“-”等奇奇怪怪的符号,如果有可以改成下划线“_”或者删掉。
7)接下来就是最后一步了,上传数据。在这里,我们需要安装一个IBM的软件——Aspera Connect用于大数据传输(下载地址:https://downloads.asperasoft.com/en/downloads/8?list,下载安装即可,推荐使用360浏览器,与Aspera关联比较方便,如果实在不会使用可以留言或者加小编微信获取详细使用方法)。
8)选择图中第一个选项,在choose files选择你的所有文件,网站会自动使用Aspera帮您上传文件,速度很快。出现下图的界面就说明正在上传中了。
9)上传完成后点击Continue后会弹出一个确认界面,信息无误后,点击Submit即可完成上传。接下来就是等待NCBI的工作人员审核数据,绝大部分情况下是没有问题的,2天内会收到确认邮件,其中就包含编辑需要的数据登录号。
END
百易汇能生物——提供专业、高效的高通量测序及多组学分析服务
百易汇能生物引进了高通量测序平台、10x单细胞平台、质谱平台以及华为超算平台。
专注于高通量测序技术在医学健康和生命科学领域的应用,提供国内领先的基因及多组学测序服务。
咨询电话:027-63497508
邮箱:market@bioyigene.com
网址:http://bioyigene.com/
公司地址:武汉东湖新技术开发区高新大道888号高农生物园总部B区20栋5层
武汉百易汇能生物科技有限公司坐落于武汉光谷高农生物园总部,是一家专注于第二代、第三代测序技术在人类健康和生命科学研究两大领域应用的高新技术企业。公司现有软件著作60余项,发明专利6项;公司成立以来累计参与发表文章170余篇,其中包括Cell,Nature Genetics,PNAS,Food Chemistry等各领域顶级期刊。
网友评论