RFDiffusion如何选择Hotspots?
一、理想的Hotspot特点:
| 特性 | 解释 |
|---|---|
| 功能性 | 这个残基和蛋白质功能直接相关,比如催化活性、底物结合、信号传递。 |
| 表面暴露 | 残基要在蛋白表面、容易被binder接触,埋藏在核心的残基不合适。 |
| 物化性质适合 | 热点残基最好能形成氢键、疏水作用、π-π相互作用,比如 Tyr、Trp、Arg、Asp。 |
| 高能量贡献位点 | 根据能量分解分析(如MM-GBSA、Rosetta接口分析),绑定能量集中在这些残基上。 |
| 结构稳定 | 选择那些在不同构象下都保持位置比较稳定的残基。太灵活的位置不适合做Hotspot。 |
二、具体选择Hotspot的方法:
| 方法 | 具体怎么做 | 举例 |
|---|---|---|
| 基于已有结构 | 看已有的蛋白-配体、蛋白-蛋白复合物结构,找出关键结合残基 | 查PDB结构,比如PDB 6M0J(ACE2-Spike复合物) |
| 能量贡献分析 | 用分子动力学 + MM-GBSA分解各个残基对结合能的贡献 | 选 ΔG_binding 贡献 > 1 kcal/mol 的残基 |
| 界面分析(buried SASA变化) | 看哪些残基结合前后埋藏面积变化最大(界面变化大=重要) | 用软件 like PyMOL / Chimera / Rosetta InterfaceAnalyzer |
| 序列保守性 | 重要功能残基通常是进化保守的,可以用Consurf或者Jalview分析 | |
| 突变实验数据 | 文献中通常有功能性残基的突变研究,失活/失结合的残基是好Hotspot | |
| 机器学习预测 (高级) | 用BudeAlaScan、KFC2、Robetta等工具预测界面热点 |
三、用Pymol找
整体步骤
-
下载结构
-
用PyMOL看表面暴露的残基
-
找界面附近的重要残基
-
筛选出Hotspots
第1步:下载PDB结构文件
第2步:用PyMOL打开
第3步:高亮显示表面残基
点击查看代码
# 把链A显示为表面
select chainA, chain A
show surface, chainA
color gray, chainA
# 选出暴露在表面的氨基酸
get_area selection=chain A, load_b=1 # 计算每个原子的SASA并保存到B-factor列(PyMOL的小trick)
select surface_residues, chain A and (b > 2.5)
show sticks, surface_residues
color green, surface_residues
注意,代码块中:
chain A ➔ 指定你的链
(sasa > 2.5) ➔ 选出溶剂可及面积大于2.5 Ų的原子(可能报错,所以先运行get_area...)
surface_residues ➔ 新选出的表面残基
直接 show sticks 和 color green 显示它们
第4步:找靠近催化口袋的区域
点击查看代码
# 选出锌离子和它附近的残基
select zinc, resn ZN
select pocket_near_zinc, byres (br. zinc around 8)
show sticks, pocket_near_zinc
color magenta, pocket_near_zinc
这样就能把Zn附近8Å以内的所有残基都选出来, 这些通常就是binding pocket里的核心残基
第5步:结合两者,筛选Hotspots
- 看既暴露在表面又靠近Zn²⁺ pocket的残基
- 通常这些是最有机会成为binding热点的
另外:
✅ Hotspots一般优先选:
-
疏水核心残基(Leu, Phe, Ile, Val)
-
电荷中心残基(Arg, Asp, Glu)
-
有可能形成氢键的残基(Ser, Thr, Asn, Gln)
✅ 最好至少挑3~5个Hotspots,设计的时候要求binder靠近它们
浙公网安备 33010602011771号