目前,投稿主流的蛋白质组学杂志及其他非组学杂志时,一般会要求作者在第三方平台上提交蛋白组学的原始数据。ProteomeXchange(简称PX)是优先推荐的上传蛋白质学质谱数据的存储平台(http://www.proteomexchange.org),旗下包括了PRIDE Archive, MassIVE, PeptideAtlas, and jPOST等平台,研究者可以根据需要选择通过ProteomeXchange客户端直接上传原始数据或通过旗下平台进行上传。iProX是国内的上传蛋白质学质谱数据的存储平台(http://www.iprox.org),因服务器在国内,数据上传的速度相对较快,国内研究者可以选择该平台进行数据提交。PX与iProX虽平台不同,操作起来有所差别,但两者对数据的要求和提交模式都是一样的,大家可以根据的实际需要和个人喜好选择一个平台进行数据提交。
经过一番选择,最终确定了提交数据的平台,那么对于具体的数据要求及模式又有哪些呢?
↓↓↓↓↓
提交数据文件要求
每一个提交的dataset都需要包括:
Peptide / protein identification files肽段蛋白质鉴定文件,称为“RESULTS”。
mass spectrometer output files质谱输出文件,称为“RAW”。既可以是仪器直接输出的raw文件,也可以是高度加工过的XML标准形式(mzXML或mzML)文件。
Optionally other files:包括peaklist files文件(称为“PEAK”),search engine output files文件(称为“SEARCH”,是Partial submissions提交时所必须的),quantification files定量文件及其他的后加工的文件等。
提交模式
目前最常使用的提交模式主要有两种:
complete submission
PRIDE能够直接处理的Peptide / protein identification files格式(目前是PRIDEXML,未来还包括标准的mzIdentML)及由其他工具转化的mzIdentML文件,可采用此模式提交。此模式为推荐的模式。“RAW”文件需要与“RESULT”PRIDEXML文件一起提交。
Peaklist(“PEAK”)、searchengine output(“SEARCH”)、定量和其他后处理文件(“OTHER”)也可依次提交但非强制。提交后会得到唯一对应的ProteomeXchange登录号及DOI(DigitalObject Identifier)号。提交的数据可供支持PRIDEInspector的杂志审稿时审阅,发表公开后数据可通过FTP下载。
需要注意的是,PRIDE Converter的下载地址为:https://code.google.com/p/pride-converter-2/,很可惜的是目前国内用户因谷歌访问权限问题已不能正常下载和使用。
partial submission
此模式是搜索结果不能被PRIDEConverter 2转化为PRIDE XML或其他工具转化为mzIdentML时才采用的提交模式。通常不推荐采用这种模式,因为这种模式会明显降低数据的可见度和重复利用度。“RAW”文件需要与searchengine output files(“SEARCH”)一起提交。提交后会得到登录号,但没有DOI号。提交的数据可供杂志审稿时审阅,公开发表后可通过FTP下载。但因PRIDE访问权限问题及数据分析软件查库结果格式等影响,partial submission为实际数据上传过程中更经常用到的模式。
蛋白质组学有多种项目类型,也用到了多种数据分析软件,每种项目和软件的结果会有所不同。
网友评论