蛋白-蛋白对接简述
所有生命活动中,蛋白质之间的相互作用是必不可少的,它是细胞进行一切代谢活动的基础。为了更好地理解细胞的生物学活性,必须很好地理解蛋白质单体和复合物的功能,这就会涉及到蛋白质相互作用的研究。蛋白质-蛋白质相互作用与识别的研究是生命科学领域的重要研究内容 ,用计算的方法来进行蛋白-蛋白对接是对实验测定复合物结构的重要补充。用于治疗疾病的药物分子通常调节或阻断蛋白-蛋白相互作用,因此蛋白-蛋白相互作用位点也代表了一类重要的药物靶点。
根据用于对接的蛋白结构的不同来源,蛋白-蛋白对接可以粗略的分为两大类:结合对接(bound docking)和未结合对接(unbound docking)。二者的区别在于,结合对接中用到的蛋白结构来自于他们结合形成的复合物,而未结合对接中所用到的蛋白结构来自于它们未和其他蛋白结合时的单体结构。大部分情况,只有受体和配体在结合之前的结构是已知的,需要用未结合对接来预测复合物的结构。未结合对接的一个困难就在于蛋白质构象的改变。下面主要介绍未结合对接的流程。
一般的蛋白-蛋白对接流程(如下图所示)
- 蛋白旋转自由度定义和相互识别的设置;
- 蛋白-蛋白相互作用的搜索方法选择;
- 精细优化,进行聚类分析;
- 蛋白-蛋白复合物的结合模式预测。
数据引导的蛋白-蛋白对接流程
- 随机旋转,刚体能量优化
- 在扭转角空间进行半刚体模拟退火
- 用显示的溶剂模型在笛卡尔空间进行能量优化
- 用界面残基主链的RMSD对构象进行聚类
- 根据簇的平均相互作用能(静电能、范德华能、模糊的相互作用约束能)和平均包埋表面积对簇进行分析和排序
高分辨率蛋白-蛋白对接流程
- 从蛋白质单体创建蛋白蛋白复合体,考虑模型侧链柔性;
- 蛋白- 蛋白界面原子细节的显式模型,考虑整个复合体柔性;
- 精细优化后进行能量优化;
- 进行柔性对接或系综对接;
- 复合体结合模式预测和结果评估。
CAPRI预测的质量评价标准
fnat:指的是预测的复合物中非天然的残基-残基接触的数除以那个复合物中所有接触的数目。(接触的定义是,两个属于不同蛋白的残基,如果他们的任意原子间的距离在5Å以内,则认为这两个残基是接触的。)
L_rms:将预测的复合物的受体和目标复合物的主链原子重叠,计算配体的RMSD。
I_rms:将预测的复合物和目标复合物的界面残基的主链原子重叠,并计算它们的RMSD。
预测的结果根据fnat,L_rms和I_rms 三个参数分为四类:高精度,中等准确度,可以接受的准确度,以及不正确的。