数据上传需要知道的小知识
为什么上传数据?
1. 供审稿人检查数据与数据处理流程。
2. 与学术界共享,其他人得以再次利用数据进行深度挖掘或不同角度进行研究(你也可以下载并再利用别人的数据)。
3. 增加自己的引用率。
4. 给自己节省数据储存空间。
5. 督促研究者提供好数据!杜绝学术不端!
蛋白组上传什么数据?
1. 质谱原始数据,“只要是论文发表中用到的都上传”。
2. 搜库结果文件。
3. 其它表格。
4. 注释信息。
蛋白组学数据上传主流数据库有哪些?
ProteomXchange数据联盟包含很多数据库,PRIDE和IProX都是其成员,中国学者推荐使用IProX储存数据。接下来我们以IProX数据库为例,介绍一下上传数据的方法。
01—登陆数据库
当然,这个网页有中文版本,(毕竟是国家蛋白质中心的网站,还是很友好的)。既然有中文版本,那我们话不多说,直接进入主题,第一步(常规操作,搞事情没有会员卡怎么能行),注册账号,登录。界面如下:
登录之后,点击:通过网页提交数据。
02—创建Project
Project Title:简述自己的项目
Key words:自己项目的关键词
Description:描述自己的项目(需要多于50个单词,论文都写好了,这些当然不在话下)
接下来Institution,leader什么的按照情况填写即可。后边这个Access Level也是按需填写,有立刻发布,也可以拟发布,这个影响不大。
填写完成后,点击Continue,如果有错误,都是简单的问题,根据提示修改即可。
03—项目细节填写
1. 物种信息:这个数据库收录了绝大部分的物种,点击灰色的框框会出现弹窗,弹窗让你选择的物种,如果常用物种没有,就需要点击弹窗里的CV terms search,输入物种拉丁文名搜索即可,本文以桃树为例,弹窗截图也附在后边。
2.MS instrument:质谱仪,可咨询做项目的公司,现在通常是QE的HF。
3. 带星号的必填项填写完成,即可点击Continue(需要先点击保存才能点击Continue,所以辛苦各位动动手指喽~)。
04—上传数据
推荐使用Aspera上传(Aspera下载参照上篇微信推送文章--转录组数据上传),下边的两个选项,小编为了省事选择了partial submission(partial submission上传的数据只能用于储存和下载,小编感觉已经够用了)。然后点击Add file把需要用到的原始数据的文件录入网站。这里除了质谱的原始数据(一般以.RAW结尾,也有.wiff、.mzXML等等),还要上传搜库的结果,搜库结果文件可以向测序公司索取。原始数据的File Type选择Raw,搜库结果选择Search。
点击Strat upload,浏览器会自动启动Aspera,出现下图弹窗。证明数据已经在上传。网速快的时候上载速率可以达到30Mbps,1G的raw data上传仅需3min(为IBM的大神点赞)。这里会碰到一个小问题:启动Aspera后需要填写一个账号密码,直接按照上面红色的提示填写“guests”即可。上传成功后在Data File会出现你已经上传成功的文件名称,如下图(如果没有可以刷新页面),然后Continue。
05—确认信息
把刚刚上传数据的项目前边的框框打上勾勾,然后点击Submit即可。然后要等待的就是管理员的审核,一般3-5天会给答复。
网友评论