美文网首页蛋白组数据处理
A4: 蛋白质组搜库--安装,建库,搜库,整合,分析

A4: 蛋白质组搜库--安装,建库,搜库,整合,分析

作者: vicLeo | 来源:发表于2022-09-21 10:54 被阅读0次

    搜库前准备

    搜库前应重装系统,清空不必要的东西,可在服务器A4, A5重装win7 PE版本(自带U深度PE装机工具);安装完后需要激活一下win7

    安装,均在A4服务器的C盘
    1. apache(一个网络服务器)安装:D:\Program\Proteome\MASCOT_v2.3
      点击exe安装, 填写邮箱名可以是假的,但必须跟后面保持一致(如66@.com);登录localhost时(http://127.0.0.1/)出现 it works!为安装成功

    2. Perl x64 语言安装 (Mascot是基于Perl语言编写的)
      D:\Program\Proteome\MASCOT_v2.3
      3.Mascot x64 安装:D:\Program\Proteome\MASCOT_v2.3
      安装时,要找到安装包内的mascot.licence 的具体路径,将其粘到指定的licence 框内
      mascot.licence 的具体路径: D:\Program\Proteome\MASCOT_v2.3

    为了让apache读懂Mascot,需要将/MASCOT/ 文件夹内的httpd.config文件中的全部内容,黏贴到/apache/文件夹内的httpd.config文件尾部,保存后重新打开apache,restart一下apache,再刷新Mascot网页。成功则可看见Mascot 网页的相关搜库内容。
    PS: 若刷新网页失败,多半是因为apache没有被打开,或重启成功,多重启尝试则可!

    4.Netframework 安装
    为了可对搜库进行批量操作,需要使用Daemon,但Daemon安装前,需要安装Netframework 4.5版本,Netframework在此类似JAVA,用于解释.exe软件
    存放路径:D:\Software\Drivers\Package\NetFramework
    PS: 1. Netframework 4.5用于win 7电脑;若在win10 上安装Daemon,则不需要安装Netframework

    1. Daemon 安装(也称Mascot Daemon)D:\Program\Proteome\MASCOT_v2.3
      Daemon可对搜库进行批量操作。

    2. Scaffold安装 D:\Program\Proteome\Q+S
      1)重装服务器后,本机的时间需要该licence的时间,安装时将licence 粘进对应的框(sn.txt文件为licence)
      2)在【控制面板】,进入【防火墙】,高级设置,选【出站规则】,【新建规则】,选【程序】,将Scaffold文件夹下的 jre/bin/javaw.exe block掉, 选【阻止连接】,再随便重命名一下
      c:/program file/scaffold 4

    MASCOT搜库

    1. peptide Mass Fingerprint 是按蛋白的KD数进行搜库;
    2. 单个Raw文件可在Ions Search进行搜库,但前提需要将raw文件的.wiz格式转为mgf格式
      3.搜库前建库:
      1)可在uniprot上下载所需的物种参考氨基酸序列:
      在Taxonmy下,选view protein,选择Swiss prot(这个参考序列属于一个基因对应一个全长protein),
      选择.fasta格式进行下载 (有时候注释时也需要将其.txt格式的文件一起下载)
      2)进入MASCOT网页,导入数据库http://a4/mascot
      在 Configuration editor进入,选database maintence, 进入建库操作面板,修改:
      (1)选上Active, AA(氨基酸),mem lock(把数据放入内存进行搜库);
      (2)将路径C:/MASCOT/sequence/Mouse/GRCm38.fa输入指定框,并修改为:C:/MASCOT/sequence/Mouse/GRCm38*.fa
      (3)只保留parse accession 和 parse description 这两项,并且parse accession选4th项,parse description 选5th项,后面的空格全清空,再点击test definition 看格式是否喜欢,最后确定正确不报错时点击Apply 使用。
      (4)然后在MASCOT网页database status(http:/a4/mascot/x-cgi/ms-status.exe)上疯狂F5刷新,观察status达到 In use(在刷新时,索引fasta文件会慢慢进入MASCOT,需要稍等)

    Daemon的搜库前工作

    1.先导入/IBS/文件夹已有的参数设置:D:\Program\Proteome\MASCOT_v2.3\IBS ,再保存为tmp.par,再在Task Editor导入,保存在/IBS/parameter/。
    2.导入馏分,理论上每个馏分都单独进行搜库;
    PS: 馏分输入下面有一个选项,[Merge MS/MS],这一项适用于多个馏分对应一个样本的情况,才可以merge

    1. 在MASCOT建库成功后,重启Daemon 可见新库已建入,run即可;
    2. 搜库完成后,结果放在:MASCOT/data/.dat,均可用Scaffold进一步整合分析,也可用高级版的MASCOT查看其他相关信息;
      PS: 1. 理论上1个mgf文件对应1个dat文件,均可在Daemon的进程列表上查询;
      2.基本上按照输入顺序搜库,序号为输出的终止时间。

    Scaffold整合文件及分析

    官网下载Install_Scaffold_Q+S_5.2.0_Windows_x64或4.0版本,安装后导数据。

    1. 将MASCOT/data/.dat的搜库结果,先按组别名字划分好文件夹,按组顺序分别导入,如三次重复组:A,B,C仨组(x 21个馏分)分别进入;
    2. 导入时若报错memory不足,可在【Edit】中的【Preference】中,设置【Memory】为16G(16000MB);
    3. 统计分析:进入【Quant】中【Update Experimental Design】,设置:
    1. 设【Analysis Type】为Ratio-based;
    2. 设【Experiment Type】为Between-subjects(Independent Groups);
    3. 设【Edit Sample Names and Categories】设置组数以及对应的组别颜色;
    4. 设【Organize Quant Samples】中,将每组对应的馏分拖进改组,设置【Reference】为control 组的馏分,Finish 后 Update Samples;


      3e9762b407ecb2a85d746c5b2d5bade.jpg
    1. 保存为.sf3文件,方便后续导入;
    2. 导出数据前,可设置:
      1)【hide decoys】去掉decoys;
    1. Min peptides=2 或FDR threshold=1%;
    2. Protein Threshold=99% , Peptides Threshold=95%(若蛋白过少,可放松俩阈值到90%);
      4)选择【Quant】中【Launch Q+ Quantitation Module】模块,进行需要一段时间,选择【Display Options】为Fold Change Ratio,然后右键选择【Copy All Data】,黏贴到新的Excel表格去。

    相关文章

      网友评论

        本文标题:A4: 蛋白质组搜库--安装,建库,搜库,整合,分析

        本文链接:https://www.haomeiwen.com/subject/ypgrwrtx.html