美文网首页生物信息学从零开始学生物信息学与算法
Rosetta InterfaceAnalyzer:分析蛋白质相

Rosetta InterfaceAnalyzer:分析蛋白质相

作者: ROSETTA研习社 | 来源:发表于2019-05-16 23:59 被阅读3次

本文参考: https://www.rosettacommons.org/demos/latest/public/analyzing_interface_quality/README

本教程所需的文件均位于: $ROSETTA/demos/public/analyzing_interface_quality

译者: Ada / Kun

本文将以甲型流感病毒H1N1亚型血凝素/人工设计的HA结合蛋白结合复合物(PDB:3R2X)为例,介绍如何利用Rosetta中InterfaceAnalyzer来快速分析蛋白-蛋白相互作用,并提取有价值的信息。

InterfaceAnalyzer的主要应用:

  • 蛋白-蛋白分子对接
  • 蛋白-蛋白相互作用界面突变设计
  • 蛋白-蛋白相互作用界面分析

注意: InterfaceAnalyzer不可用于蛋白质-小分子相互作用界面分析。

1 准备输入文件

快速修复输入PBD结构:

使用Rosetta score_jd2 app对输入的PDB文件进行打分是一个快速修复结构的方法,确保输入文件能够正确地被Rosetta读取。(bug提示: 3r2x中存在残基插入码,如A链的264A Gly,因此需要对整个PDB结构进行重编号,否则packsat计算异常。)

# 进入工作文件夹
cd $ROSETTA/demos/public/analyzing_interface_quality/rosetta_inputs

# 对输入文件进行打分
score_jd2.mpi.macosclangrelease -s ../starting_files/*.pdb.gz -no_optH false -ignore_unrecognized_res -out:pdb

# 重命名,以便于与输入文件区分开来。
mv 3r2x_0001.pdb 3r2x_scored.pdb

score_jd2 app选项注释:

  • -no_optH false:是否考虑谷氨酰胺、天冬酰胺以及组氨酸的构象翻转?(设置为True,将有利于优化包埋在蛋白内部而又未饱和成键极性原子)。

  • -ignore_unrecognized_res:删除水分子以及其他未能被Rosetta识别的残基分子。

  • -out:pdb:这会强制score_jd2应用程序输出PDB文件,以便稍后使用。

运行后,我们将得到3r2x_0001.pdb,并将其重命名为3r2x_scored.pdb,作为下一步的输入文件。

准备运行参数文件

新建文件,输入以下参数来控制InterfaceAnalyzer计算模式:

  • 优化侧链的模式(推荐使用!)
  • 非优化侧链的模式(除非输入的结构已经是经过优化和能量最小化处理,避免使用)

以优化侧链的模式的参数文件: pack_input_options.txt文件为例说明参数意义。

#specific options for InterfaceAnalyzer
-use_input_sc 
-compute_packstat true # 是否输出packstat值进行运算,评估蛋白作用界面的契合度。
-tracer_data_print true # 是否在屏幕上输出结果

# 蛋白质侧链优化选项。
-out:file:score_only pack_input_score.sc # 输出的打分文件名称
-pack_input true     # 是否对输入文件的相互作用界面进行氨基酸侧链重排优化?
-pack_separated true # 将每条蛋白质链分离,并进行侧链优化,这对界面ddG分析有用
-add_regular_scores_to_scorefile true # 是否使用标准打分函数?

#these are some tweeks that we have found helpful
-atomic_burial_cutoff 0.01 # 鉴别包埋极性原子的标准。
-sasa_calculator_probe_radius 1.4 # 蛋白表面探针的半径
-pose_metrics::interface_cutoff 8.0 # 蛋白-蛋白相互作用界面截断半径。设置越大,界面范围越大。

2 运行InterfaceAnalyzer

在3R2X模型中,甲型流感病毒H1N1亚型血凝素由A、B链组成的异源二聚体,HA结合蛋白为C链。我们将AB作为一个整体考虑,因此需额外加上fixedchains选项。

  • -fixedchains A B 代表:将A链与B链作为一个整体考虑,不对AB之间的相互作用进行分析。

打开终端,输入以下命令:

  • 如果需要使用非优化侧链的模式,将pack_input_options.txt替换为no_pack_input_options.txt即可。
  • 如果想要packstat值更收敛,需要加上: -packstat::oversample 100
InterfaceAnalyzer.mpi.macosclangrelease -s 3r2x_scored.pdb -fixedchains A B @pack_input_options.txt

3 结果分析

查看终端输出:(需要将参数文件中,将compute_packstat设置为true),打分结果详细罗列在屏幕上,同时,我们也可以用文本编辑器或电子表格应用程序打开pack_input_score.sc文件,查看分析结果。

interface.png

InterfaceAnalyzer中几个重要的指标:

  • 蛋白结合自由能(dG_separated):如果没有使用优化侧链的模式的参数,你会发现计算所得的ddG值是不真实的,因为输入文件中存在原子对之间的不合理排布。因此在计算过程中对侧链重排是必要的。

  • 未饱和成键的极性原子数量(delta_unsatHbonds): 未成对的极性原子越多,蛋白-蛋白相互作用越弱。值得注意的是,经过Rosetta优化后可能会出现更多的未饱和成键的极性原子,因为程序试图缓解结构之间冲突。

  • 堆积紧密度(packstat):这是衡量界面填充程度如何的一个指标(区间0~1.0)当值为1.0时,代表蛋白之间完美互补。(通常值大于0.65是好的)

  • 形状互补度(shape_complementarity): 对于抗体分析而言shape_complementarity打分能更好地代表两个分子之间的互补度。(from Jared Adolf-Bryfogle)

  • 包埋表面积(dSASA_int):衡量相互作用界面大小的指标,单位 Angstroms^2。

  • 每单位面积的结合自由能(dG_separated / dSASAx100):以dG_separated结合能除以包埋表面积值(dSASA_int)所得。通常低于-1.5的值就非常好。

有兴趣的朋友,可以尝试将此模型界面氨基酸进行突变,再计算分析界面ddG的能量变化。

相关文章

网友评论

    本文标题:Rosetta InterfaceAnalyzer:分析蛋白质相

    本文链接:https://www.haomeiwen.com/subject/lnsgaqtx.html