基本简介
原始数据(Raw data) 指测序下机后未经处理的全部原始数据文件,SRA是NCBI中收录原始数据的主要数据库,有454,Illumina,SOLiD,IonTorrent,Helicos 和CompleteGenomics的下机数据,最为常见的是illumina 产生的fastq格式数据。
一:注册NCBI账号
点击NCBI主页my profile填写个人信息(用户名,密码,邮箱),并向NCBI发送邮件确认邮箱号,构建NCBI账号。如果已有账号,点击sign in直接登录。
链接:https://submit.ncbi.nlm.nih.gov/
二:申请BioSample号和BioProject号
在提交原始数据前,我们需要先申请BioSample号和BioProject号,主要填写一些描述样本、测序方面的相关信息。点击New submission开始填写,下图为填写内容简介。链接:
https://submit.ncbi.nlm.nih.gov/subs/biosample/
https://submit.ncbi.nlm.nih.gov/subs/bioproject/
三:提交原始fastq格式文件至SRA
当完成上面两步时,已申请的Biosample和Bioproject号待用,点击New submission开始填写,下图是填写内容简介。链接:
https://submit.ncbi.nlm.nih.gov/subs/sra/
总结
越来越多实验会涉及到测序。细菌、真菌、宏基因组、RNA-seq、16S等等。虽然测序公司帮助你做了数据分析,但是当你投文章的时候,难免会被编辑或者审稿人问道:你的原始数据提交到公共数据库了吗?或者请提供能找到测序数据的accseeion number?这个时候,如果你的样本少,数据量小,你可以考虑自己通过网页上传哦,再也不用担心文章发表时没上传原始数据了。
网友评论