分子动力学驱动的药物发现(一)

分子动力学驱动的药物发现(一)

20170710_tetramer_side

鉴于开发新药的时间和财务成本显著,采用新技术不断改革药物研发管线,将候选药物发展为最有希望的先导化合物进行临床测试仍非常关键。过去十年来,计算能力大幅增长,使得计算机方法能够加速药物发现过程。分子动力学(MD)已成为药物设计和发现中特别重要的工具。从经典的MD方法到更复杂的混合经典/量子力学(QM)方法,MD模拟能够为配体-受体相互作用提供不一样的理解。

002.01

MD是一种计算方法,在基于结构的药物设计(SBDD)、探索蛋白质的能量和鉴定其生理构象方面尤其有价值。在许多情况下,蛋白质的形态甚至不能通过高分辨率实验技术进行测定。MD也可用于复合物的结构优化,使得在复合物状态下配体和受体之间的互补性增强,从而使复合物得到更好的再打分(rescore)。

经典分子动力学

MD是研究生物系统的平衡结构和动态相互作用最广泛使用的计算技术。它提供了对生物系统结构的时间依赖性变化和构象变化更多的理解,这可能与其功能有关。经典MD将原子视为固体球体,将它们连接成弹簧。允许系统中的原子仅在指定距离内振荡。经典MD基于牛顿运动方程:

1-2017-07-07_152741

Fi是作用在具有质量的第i个原子的合力的组成部分。mi、ri表示t时刻的原子位置。力可以计算为::

2-2017-07-07_153042

其中,U(ri,r2,…,rn)是特定构象的势能函数,并且可以通过使用具有预定义参数的力场的概念来描述。力场是包含势能的函数形式的数学表达式,其包括系统中不同原子之间可能的键合(键、角和二面体)以及非键合相互作用(范德华势和库仑势)项。通常使用简谐势函(harmonic potential function)对键伸展和角度项进行建模,而二面角用余弦函数表示。非键合术语使用Lennard-Jones势和库仑定律建模。在周期边界条件下的粒子网Ewald(PME)方法通常用于经典的MD模拟,以处理系统中的远程静电相互作用。

比较不同力场的性能通常是有问题的,因为输出取决于所研究的系统类型和性质。然而,已经有一些努力来比较不同的力场,并且大多数人发现系统的结构和动力学的结果随力场而变化。有时,力场的选择也可能取决于模拟中涉及的水模型的类型。

figure2

MD方法的主要优点在于能够模拟典型生物学问题的实验条件。例如,通过控制诸如温度、压力、原子数、离子浓度和溶剂的类型等不同因素进行实验。在统计力学组合的背景下,所有这些因素在MD模拟中可以调整和控制。这些系综包括微正则系综(恒定的总能量)、正则系综(恒定温度)和等温等压系综(恒温和压力)。微正则系综是最基本的方法,包括恒定数量的粒子(N)、恒定体积(V)和恒定能量(E)。然而,由于保持恒定总能量的条件是不现实的,所以通常使用正则系综(NVT)和等温等压系综(NPT)。事实上,等温等压系综(NPT)是MD模拟中使用最广泛的系综,因为它反映了实际的实验条件。

 

MD模拟和蛋白质柔性

蛋白质的动态性质是一个很好的现象。蛋白是柔性生物分子,可以在溶液中采用多种构象状态。这些构象不能有效地结合环境中的配体或其它系统。例如,蛋白质的某些构象可以改变开放状态,使水分子能够接近通道和配体自由地结合或解绑。相比之下,在相同蛋白质的一些其它构象中,高度可延展的环可以部分或完全阻断通道,从而限制配体进入。此外,配体的结合也可以导致蛋白质的构象变化,从侧链的局部重组到结构域的铰链动力学结果。因此,通常在化学反应过程中蛋白质的自由能景观中在低能量和高能量分开的不同构象状态之间转换。通常在无配体结构中不易检测到这种隐性或变构结合位点。因此,这些位点通常不能从单个代表性结构中检测到,而需要大量的构象采样来揭示在MD中的应用,一个成功的故事是在HIV整合酶中发现新的配体结合区域。2004年,Schames等研究人员利用HIV整合酶和对接的配体一起进行的MD模拟,发现了一个新的配体结合区。这个神秘结合区域也被后来的X-晶体学实验证实。随后,默克公司的科学家和他们的合作者对这种新的结合位点进行了大量实验研究,最终导致了新型抗HIV抑制剂雷特格韦的发现。

3-2017-07-07_175056

因此,在SBDD中使用蛋白质构象系综而不是单一构象是是非常有优势的。然而,由于高成本和技术复杂性,用于不同构象的实验确定的结构仅可用于少量蛋白质。现在正在使用MD模拟来采集蛋白结构系综以弥补这一差距。在该MD方案下,靶标结构首先经历大规模的MD模拟,随后是RMSD构象聚类,以累积蛋白质结构所有可能构象。随后,使用诸如主成分分析(PCA)的统计分析方法将相关变量的原始空间变换成包括系综最重要的动力学的一组减少的独立变量。这使得蛋白质结构的系综可以用于基于对接的虚拟筛选。考虑受体灵活性的MD方案普遍称为“relaxed complex scheme”(RCS)。RCS已经成功应用于多项研究,例如,MDM2是一种高度灵活的蛋白质,在一项研究中,Bowman等研究人员进行了p53-MDM2复合物的MD模拟,产生了体系的多个构象,以便在随后的基于对接的虚拟筛选中考虑蛋白质的柔性。在此基础上发现人MDM2-p53相互作用的五种小分子抑制剂,其中一种化合物Ki值为80-130nM。这些小分子具有不同于已知MDM2-p53相互作用抑制剂的骨架。因此,通过结合RSC方法,可以发现新颖的有潜力的小分子。

4-2017-07-07_174847

结合其他计算方法,MD模拟可以帮助表征蛋白-蛋白相互作用。这些类型的相互作用在生物过程中具有重要作用,包括信号转导、细胞代谢和转运。了解这些相互作用有助于扩大更有效药物的靶标空间。虽然蛋白-蛋白相互作用界面通常很大,但只要选定的残基子集对应这些位点的强结合即可。这些残基,连同周围的区域,被称为“热点”。蛋白-蛋白相互作用也具有不被实验捕获的瞬时结合袋。MD模拟已经成为常规的方法,用于识别热点并预测其调控的结合位点。

Interação entre proteínas

相关术语

RMSD(Root mean square deviation):均方根偏差是当3D结构彼此叠加时原子之间的平均偏差或距离的度量。在分析MD轨迹时,RMSD是一个重要的数据,可用于跟踪MD模拟结构偏离其起始结构的多少。

Interaction energy:相互作用能是由两个残基之间的相互作用引起的能量项及其对系统总能量的贡献。来自靶标和结合配体的不同氨基酸残基之间的相互作用能量可能对复合物的结合亲和力具有显着影响。 因此,鉴定对配体具有高相互作用能的关键残基在结合模式分析中是重要的。

Interaction distance:相互作用距离是蛋白质的两个非键合残基之间或残基和配体之间的最小距离,可能相互影响从而影响系统的总能量。

Correlation functions:相关函数是关联蛋白质结构性质与其意义的数学描述符。 因此,相关函数仍然是MD轨迹蛋白质结构分析的重要工具。

Hydrogen bond:氢键反映了将附着于一个电负性原子的氢吸引到另一个持有孤对电子的电负性原子的静电力。因此,鉴定蛋白质结合的配体及其周围氨基酸残基之间的氢键数目是分析MD轨迹的关键步骤之一。

 

参考资料

Ganesan A, Coote M L, Barakat K. Molecular dynamics-driven drug discovery: leaping forward with confidence[J]. Drug discovery today, 2017, 22(2): 249-269.