本文参考: https://www.rosettacommons.org/demos/latest/public/analyzing_interface_quality/README
本教程所需的文件均位于: $ROSETTA/demos/public/analyzing_interface_quality
译者: Ada / Kun
本文将以甲型流感病毒H1N1亚型血凝素/人工设计的HA结合蛋白结合复合物(PDB:3R2X)为例,介绍如何利用Rosetta中InterfaceAnalyzer来快速分析蛋白-蛋白相互作用,并提取有价值的信息。
InterfaceAnalyzer的主要应用:
- 蛋白-蛋白分子对接
- 蛋白-蛋白相互作用界面突变设计
- 蛋白-蛋白相互作用界面分析
注意: InterfaceAnalyzer不可用于蛋白质-小分子相互作用界面分析。
1 准备输入文件
快速修复输入PBD结构:
使用Rosetta score_jd2 app对输入的PDB文件进行打分是一个快速修复结构的方法,确保输入文件能够正确地被Rosetta读取。(bug提示: 3r2x中存在残基插入码,如A链的264A Gly,因此需要对整个PDB结构进行重编号,否则packsat计算异常。)
# 进入工作文件夹
cd $ROSETTA/demos/public/analyzing_interface_quality/rosetta_inputs
# 对输入文件进行打分
score_jd2.mpi.macosclangrelease -s ../starting_files/*.pdb.gz -no_optH false -ignore_unrecognized_res -out:pdb
# 重命名,以便于与输入文件区分开来。
mv 3r2x_0001.pdb 3r2x_scored.pdb
score_jd2 app选项注释:
-
-no_optH false
:是否考虑谷氨酰胺、天冬酰胺以及组氨酸的构象翻转?(设置为True,将有利于优化包埋在蛋白内部而又未饱和成键极性原子)。 -
-ignore_unrecognized_res
:删除水分子以及其他未能被Rosetta识别的残基分子。 -
-out:pdb
:这会强制score_jd2应用程序输出PDB文件,以便稍后使用。
运行后,我们将得到3r2x_0001.pdb,并将其重命名为3r2x_scored.pdb,作为下一步的输入文件。
准备运行参数文件
新建文件,输入以下参数来控制InterfaceAnalyzer计算模式:
- 优化侧链的模式(推荐使用!)
- 非优化侧链的模式(除非输入的结构已经是经过优化和能量最小化处理,避免使用)
以优化侧链的模式的参数文件: pack_input_options.txt文件为例说明参数意义。
#specific options for InterfaceAnalyzer
-use_input_sc
-compute_packstat true # 是否输出packstat值进行运算,评估蛋白作用界面的契合度。
-tracer_data_print true # 是否在屏幕上输出结果
# 蛋白质侧链优化选项。
-out:file:score_only pack_input_score.sc # 输出的打分文件名称
-pack_input true # 是否对输入文件的相互作用界面进行氨基酸侧链重排优化?
-pack_separated true # 将每条蛋白质链分离,并进行侧链优化,这对界面ddG分析有用
-add_regular_scores_to_scorefile true # 是否使用标准打分函数?
#these are some tweeks that we have found helpful
-atomic_burial_cutoff 0.01 # 鉴别包埋极性原子的标准。
-sasa_calculator_probe_radius 1.4 # 蛋白表面探针的半径
-pose_metrics::interface_cutoff 8.0 # 蛋白-蛋白相互作用界面截断半径。设置越大,界面范围越大。
2 运行InterfaceAnalyzer
在3R2X模型中,甲型流感病毒H1N1亚型血凝素由A、B链组成的异源二聚体,HA结合蛋白为C链。我们将AB作为一个整体考虑,因此需额外加上fixedchains
选项。
- -fixedchains A B 代表:将A链与B链作为一个整体考虑,不对AB之间的相互作用进行分析。
打开终端,输入以下命令:
- 如果需要使用非优化侧链的模式,将pack_input_options.txt替换为no_pack_input_options.txt即可。
- 如果想要packstat值更收敛,需要加上: -packstat::oversample 100
InterfaceAnalyzer.mpi.macosclangrelease -s 3r2x_scored.pdb -fixedchains A B @pack_input_options.txt
3 结果分析
查看终端输出:(需要将参数文件中,将compute_packstat
设置为true
),打分结果详细罗列在屏幕上,同时,我们也可以用文本编辑器或电子表格应用程序打开pack_input_score.sc
文件,查看分析结果。
InterfaceAnalyzer中几个重要的指标:
-
蛋白结合自由能(dG_separated):如果没有使用优化侧链的模式的参数,你会发现计算所得的ddG值是不真实的,因为输入文件中存在原子对之间的不合理排布。因此在计算过程中对侧链重排是必要的。
-
未饱和成键的极性原子数量(delta_unsatHbonds): 未成对的极性原子越多,蛋白-蛋白相互作用越弱。值得注意的是,经过Rosetta优化后可能会出现更多的未饱和成键的极性原子,因为程序试图缓解结构之间冲突。
-
堆积紧密度(packstat):这是衡量界面填充程度如何的一个指标(区间0~1.0)当值为1.0时,代表蛋白之间完美互补。(通常值大于0.65是好的)
-
形状互补度(shape_complementarity): 对于抗体分析而言shape_complementarity打分能更好地代表两个分子之间的互补度。(from Jared Adolf-Bryfogle)
-
包埋表面积(dSASA_int):衡量相互作用界面大小的指标,单位 Angstroms^2。
-
每单位面积的结合自由能(dG_separated / dSASAx100):以dG_separated结合能除以包埋表面积值(dSASA_int)所得。通常低于-1.5的值就非常好。
有兴趣的朋友,可以尝试将此模型界面氨基酸进行突变,再计算分析界面ddG的能量变化。
网友评论