搜库前准备
搜库前应重装系统,清空不必要的东西,可在服务器A4, A5重装win7 PE版本(自带U深度PE装机工具);安装完后需要激活一下win7
安装,均在A4服务器的C盘
-
apache(一个网络服务器)安装:D:\Program\Proteome\MASCOT_v2.3
点击exe安装, 填写邮箱名可以是假的,但必须跟后面保持一致(如66@.com);登录localhost时(http://127.0.0.1/)出现 it works!为安装成功 -
Perl x64 语言安装 (Mascot是基于Perl语言编写的)
D:\Program\Proteome\MASCOT_v2.3
3.Mascot x64 安装:D:\Program\Proteome\MASCOT_v2.3
安装时,要找到安装包内的mascot.licence 的具体路径,将其粘到指定的licence 框内
mascot.licence 的具体路径: D:\Program\Proteome\MASCOT_v2.3
为了让apache读懂Mascot,需要将/MASCOT/ 文件夹内的httpd.config文件中的全部内容,黏贴到/apache/文件夹内的httpd.config文件尾部,保存后重新打开apache,restart一下apache,再刷新Mascot网页。成功则可看见Mascot 网页的相关搜库内容。
PS: 若刷新网页失败,多半是因为apache没有被打开,或重启成功,多重启尝试则可!
4.Netframework 安装
为了可对搜库进行批量操作,需要使用Daemon,但Daemon安装前,需要安装Netframework 4.5版本,Netframework在此类似JAVA,用于解释.exe软件
存放路径:D:\Software\Drivers\Package\NetFramework
PS: 1. Netframework 4.5用于win 7电脑;若在win10 上安装Daemon,则不需要安装Netframework
-
Daemon 安装(也称Mascot Daemon)D:\Program\Proteome\MASCOT_v2.3
Daemon可对搜库进行批量操作。 -
Scaffold安装 D:\Program\Proteome\Q+S
1)重装服务器后,本机的时间需要该licence的时间,安装时将licence 粘进对应的框(sn.txt文件为licence)
2)在【控制面板】,进入【防火墙】,高级设置,选【出站规则】,【新建规则】,选【程序】,将Scaffold文件夹下的 jre/bin/javaw.exe block掉, 选【阻止连接】,再随便重命名一下
c:/program file/scaffold 4
MASCOT搜库
- peptide Mass Fingerprint 是按蛋白的KD数进行搜库;
- 单个Raw文件可在Ions Search进行搜库,但前提需要将raw文件的.wiz格式转为mgf格式
3.搜库前建库:
1)可在uniprot上下载所需的物种参考氨基酸序列:
在Taxonmy下,选view protein,选择Swiss prot(这个参考序列属于一个基因对应一个全长protein),
选择.fasta格式进行下载 (有时候注释时也需要将其.txt格式的文件一起下载)
2)进入MASCOT网页,导入数据库http://a4/mascot
在 Configuration editor进入,选database maintence, 进入建库操作面板,修改:
(1)选上Active, AA(氨基酸),mem lock(把数据放入内存进行搜库);
(2)将路径C:/MASCOT/sequence/Mouse/GRCm38.fa输入指定框,并修改为:C:/MASCOT/sequence/Mouse/GRCm38*.fa
(3)只保留parse accession 和 parse description 这两项,并且parse accession选4th项,parse description 选5th项,后面的空格全清空,再点击test definition 看格式是否喜欢,最后确定正确不报错时点击Apply 使用。
(4)然后在MASCOT网页database status(http:/a4/mascot/x-cgi/ms-status.exe)上疯狂F5刷新,观察status达到 In use(在刷新时,索引fasta文件会慢慢进入MASCOT,需要稍等)
Daemon的搜库前工作
1.先导入/IBS/文件夹已有的参数设置:D:\Program\Proteome\MASCOT_v2.3\IBS ,再保存为tmp.par,再在Task Editor导入,保存在/IBS/parameter/。
2.导入馏分,理论上每个馏分都单独进行搜库;
PS: 馏分输入下面有一个选项,[Merge MS/MS],这一项适用于多个馏分对应一个样本的情况,才可以merge
- 在MASCOT建库成功后,重启Daemon 可见新库已建入,run即可;
- 搜库完成后,结果放在:MASCOT/data/.dat,均可用Scaffold进一步整合分析,也可用高级版的MASCOT查看其他相关信息;
PS: 1. 理论上1个mgf文件对应1个dat文件,均可在Daemon的进程列表上查询;
2.基本上按照输入顺序搜库,序号为输出的终止时间。
Scaffold整合文件及分析
官网下载Install_Scaffold_Q+S_5.2.0_Windows_x64或4.0版本,安装后导数据。
- 将MASCOT/data/.dat的搜库结果,先按组别名字划分好文件夹,按组顺序分别导入,如三次重复组:A,B,C仨组(x 21个馏分)分别进入;
- 导入时若报错memory不足,可在【Edit】中的【Preference】中,设置【Memory】为16G(16000MB);
- 统计分析:进入【Quant】中【Update Experimental Design】,设置:
- 设【Analysis Type】为Ratio-based;
- 设【Experiment Type】为Between-subjects(Independent Groups);
- 设【Edit Sample Names and Categories】设置组数以及对应的组别颜色;
-
设【Organize Quant Samples】中,将每组对应的馏分拖进改组,设置【Reference】为control 组的馏分,Finish 后 Update Samples;
3e9762b407ecb2a85d746c5b2d5bade.jpg
- 保存为.sf3文件,方便后续导入;
- 导出数据前,可设置:
1)【hide decoys】去掉decoys;
- Min peptides=2 或FDR threshold=1%;
- Protein Threshold=99% , Peptides Threshold=95%(若蛋白过少,可放松俩阈值到90%);
4)选择【Quant】中【Launch Q+ Quantitation Module】模块,进行需要一段时间,选择【Display Options】为Fold Change Ratio,然后右键选择【Copy All Data】,黏贴到新的Excel表格去。
网友评论