分子动力学驱动的药物发现(二)

分子动力学驱动的药物发现(二)

QMMM-lipid

上一篇【分子动力学驱动的药物发现(一)】主要讲述了经典分子动力学以及MD模拟和蛋白柔性,以及一些基本术语。本文在上一篇的基础上继续讲述MD模拟的相关知识和应用。

MD模拟和后对接结构优化

尽管分子对接可以对配体在受体活性位点中的最佳位置做出预测,但并不是所有配体和受体之间的关键相互作用都能被准确描绘。故建议对对接获得的复合物进行MD模拟,有助于优化蛋白和配体的相互作用。例如,在以前的研究中,分子对接预测磺酰胺衍生物有效结合到醛糖还原酶的活性位点,与实验中磺酰胺衍生物的活性相反。使用MD模拟揭示了来自外部的水分子迁移到结合位点并阻断了磺酰胺配体和受体之间的关键相互作用,这被认为是试验化合物在实验中活性降低的原因。类似地,基于系综的分子对接和后对接复合物的MD的组合有助于揭示达卡他韦与不同基因型的丙型肝炎病毒(HCV)NS5A蛋白独特的结合模式。

1-2017-07-11

以前的研究表明,诱导契合对接(induced-fit docking,IFD)方法以及MD或QM/MM模拟可用于有效描述蛋白-配体复合物的诱导分子柔性以及精确的配体结合模式分析。例如,在最近的一项研究中,Distinto等人使用IFD和MD模拟揭示1-亚芳基-2-[4-(4-氯苯基)噻唑-2-基]肼相对于单胺氧化酶B(MAO-B)的推定结合模式和活性,MAO-B是治疗神经变性疾病基友极有吸引力的靶标。通过比对不同抑制剂共结晶的MAO-B的X-ray结构,可以揭示该酶对结合的配体产生的诱导契合变化。

5-approaches

另一项研究中,Fuetal等人组合IFD与经典MD模拟,结合自由能计算和QM/ MM计算,研究底物-人胆红素-IIIa还原酶(hBVR-A)和四种类似物的结合。hBVR-A是调节一系列细胞过程的关键酶,参与了胆红素IXa转化。在IFD期间,活性部位的酪氨酸残基经过灵活处理。随后,将优势三元复合结构进行MD模拟,从MD模拟获得的多个帧用于结合自由能计算。五种类似物的预测结合自由能与实验结合亲和力一致,并有助于确定复合物的最佳结合姿势。最后,研究人员使用先进的QM/MM计算计算反应能量曲线,研究了三元复合结构的催化机理。这些高级计算对于了解所研究的系统的反应机制是有用的,从长远来看,其应该有助于设计有效的hBVR-A抑制剂。因此,MD作为一个重要的工具,不仅可以优化后对接复合物,而且可以揭示受体-配体更合适的结合模式。

MD模拟和预测结合自由能

分子识别在许多生物化学和生物过程中至关重要,许多生物过程从细胞中两个相互作用的实体之间的特异性结合开始。虽然分子对接结合MD模拟可以提供这些实体在其结合界面上形状互补性的清晰图像,现实还是需要额外的重要信息如结合自由能。结合自由能∆Gbind,即蛋白配体结合状态与蛋白质和配体相应的未结合状态之间的自由能差可用于量化配体与其靶标的亲和力。评估针对特定靶标的一系列配体的∆Gbind可以辨别与靶标具有较高结合亲和力的配体。因此,∆Gbind计算在药物设计和基于对接的虚拟筛选过程中至关重要。已经开发了几种∆Gbind的计算方法,从计算上严格的热力学路径到不太复杂的终点方法。前一种方法包括热力学积分法(TI)和自由能微扰法(FEP),而线性相互作用能(LIE),MM-GBSA和MM-PBSA 是终点法。这些方法中的每一种都有其自身的优点和局限性,其计算速度与其准确度成反比关系。

2-tutA_24

TI和FEP方法是通常用于计算相对结合自由能的热力学途径法。这些方法主要是基于热力学循环的应用,因此,需要通过系统能量函数的化学变化将系统从初始状态转换到最终状态。这些方法包括配体A改变成配体B的两种状态,如仅溶剂非结合状态和结合状态,为配体的未结合状态(∆Gunbound)和结合状态(∆Gbound)提供了自由能变化。也可以将配体A突变为“无”,原则上可以提供绝对的结合自由能。可以理解,这些方法(TI和FEP)需要多次MD模拟和刚性配体采样与蛋白质和溶剂自由度取样。因此,热力学途径方法通常能够以高计算时间的成本提供结合自由能的精确估计。例如,与MD模拟相结合的TI方法已经用于鉴定具有对乙酰胆碱酯酶的更高结合亲和力的潜在石杉碱衍生物。类似地,FEP方法还显示出预测几种酶抑制剂复合物的更准确的结合自由能。然而,使用这些方法估计∆Gbind值需要大量构象样本,反过来又大量增加了计算成本。鉴于需要巨大的计算资源,这些方法大多仅适用于小集合的配体-蛋白复合物。然而,随着超级计算能力的提高和计算方法的改进,TI和FEP逐渐被纳入到SBDD流程中,特别是在指导先导化合物优化领域。

热力学途径不太严格的替代方案是终点法,其包括诸如LIE、MM-PBSA和MM-GBSA的方法。与热力学途径法不同,这些终点法仅对参与反应途径两端的结构进行抽样;即游离蛋白质和配体以及最终的蛋白-配体复合物。方法中的∆Gbind可以写成公式:

3-2017-07-12_161857

由Aqvist等人开发的LIE方法考虑了配体结合蛋白的过程的划分问题,其中来自大量溶剂介质的游离配体转移到溶剂化蛋白质环境中。因此,需要执行两个独立的MD模拟,一个用于复合物,另一个用于溶剂化配体,需要使用LIE法计算∆Gbind。尽管如此,LIE对结合终点的依赖使其成为先导化合物优化极具吸引力的方法。几项研究显示LIE法可以用RMSE(均方根误差)来预测结合自由能与实验值比较。

MM-GBSA和MM-PBSA是SBDD中最受欢迎的另外两种已知的终点方法。这两种方法使用隐式溶剂模型来考虑溶剂分子,并使用电介质连续模型来获得溶剂化能的静电组分。MM-PB(GB)SA的 ∆Gbind可以使用公式来计算:

4-2017-07-12_162238

EMM是指分子力学能量,它是结合和非结合相互作用的所有能量的总和。溶剂化能量∆Gsolv是溶剂化的极性和非极性贡献的总和。使用GB模型或PB求解器计算极性溶剂化(∆GPB/GB)。配体和蛋白中非极性贡献基于溶剂可及表面积(∆GSASA)的大小计算。∆Gbind方程的最后一项是T∆S,其对应于配体-蛋白结合时反应产物中的构象熵变化。

6-MMPBS-MM-PBSA-and-MM-GBSA-calculation

MM-PB(GB)SA计算中包含构象熵(T∆S)以获得绝对∆Gbind仍然是有挑战性的。T∆S的准确计算在计算比较昂贵,在许多情况下,包含它并能保证最终能量的准确性更好。相反,以前的研究表明,从不充分的MD抽样获得的构象熵的计算对计算有不利影响。因此,许多研究倾向于忽略T∆S,而是使用相对∆Gbind。相对∆Gbind能量可以合理准确的预测,并可以对SBDD中抑制相同靶标的一组化合物进行排序。

MM-GBSA和MM-PBSA计算中通常使用两种策略:三轨迹方案和单一轨迹方案。原则上,三轨迹方案提供比单轨道方案更准确的结果;然而,它的计算成本更高。相比之下,单一轨迹方案仅需要对配体-蛋白复合物进行单一的MD模拟,这显着减少了所需的计算时间。除了策略的选择,还有几个因素可以影响MM-PBSA计算,其中包括模拟时间长度、力场的选择、溶质介电常数、溶剂模型和系统的净电荷。

7-MM-PBSA-and-MM-GBSA-calculations-complex-Single

已经有几项研究比较和测试了MM-GBSA和MM-PBSA预测不同配体-蛋白复合物准确的∆Gbind能量方面的效率。一般结论是这些方法的准确性往往依赖于系统。例如,研究人员在MD平衡后对核磁共振组合中存在的20个XPF结构进行了20次独立的虚拟筛选。提取每个筛选命中的最好化合物,然后根据其结合自由能进行排名。从结果中挑选73个化合物进行一系列实验,包括细胞毒性测定、稳态荧光和同步荧光实验和免疫细胞化学。最后发现一种化合物在所有实验中表现出有希望的活性,并且还能够与负责ERCC1相互作用的XPF结构域相互作用,从而破坏蛋白-蛋白相互作用。因此,基于MD的结合自由能计算有助于指导命中识别阶段。然而,两种方法的显著缺点之一是它们无法对具有正电荷的配体进行准确的预测。因此,重要的是改进现有的方法或开发可以解释带正电配体(包括互变异构体)的新方法。

参考资料:

1.Ganesan A, Coote M L, Barakat K. Molecular dynamics-driven drug discovery: leaping forward with confidence[J]. Drug discovery today, 2017, 22(2): 249-269.

2.部分图片来源于网络。