基于蛋白结构的ADMET预测

基于蛋白结构的ADMET预测

导语

药物化学项目最理想的目标是实现高效力和理想的安全性,为了达到这些目标,候选分子必须与主要靶点或靶标形成最佳的相互作用,并避免与反靶点不必要的相互作用。与非靶标的相互作用导致不期望的毒理事件。吸收(absorption)、分布(distribution)、代谢(metabolism)、排泄(excretion)和药代动力学(pharmacokinetics,PK)对功效和安全性都有显着影响,它们通常缩写为ADMET

大多数药物属于口服给药,首先将药物溶解在胃肠道中,通过肠壁吸收,然后通过肝脏进入血液循环。在分布过程中,活性药理成分通过生物屏障,到达身体各个部位、组织和器官;中枢神经系统药物通过血脑屏障进入大脑;分布使得药物能够结合其分子靶标,例如酶、受体或离子通道以发挥其药效学作用。然后将化合物再循环到肝脏中并代谢以增加其极性;最后通过尿液排出,或者在一些特定情况下经过肠肝循环通过粪便排泄。

过去十多年蛋白质工程和晶体学领域中的突破使得大多数蛋白质的原子水平结构信息被揭示,其在ADMET过程中具有突出相关性的靶点,例如血浆蛋白结合、活性转运体、细胞色素P450(CYP)介导的代谢,其抑制和诱导一些毒性相关的靶标。

考虑到ADMET相关蛋白的蛋白质建模,重要的是强调这些蛋白进化优化具有多种人血清蛋白或柔性结合位点能够识别和结合多种化合物。CYP酶家族例证了配体结合过程的复杂性,因为至少六种同工酶负责约75%市售药物的代谢。具有酮康唑的CYP3A的晶体结构包含配体的两个拷贝,为多重结合提供原子级参数,并指示相关联结合位点柔性的高水平。类似地,活性转运蛋白(P-gp)的晶体结构含有环状六肽配体的两种立体异构体;通过多个非特异性接触实现了多种化学品的结合。

药物发现是一项多维任务,需要在期望和不合需要的特性之间实现良好的平衡,以达到目标产品属性的药效和安全标准。维持与主要目标的最佳相互作用限制了化学修饰的自由以优化药代动力学特征。 因此,在计算机中,ADMET预测成为药物发现程序的一部分,例如代谢位点预测、代谢建模和转运蛋白(CAR,PXR)的诱导或HSA结合评估。

1.基于结构ADMET预测的计算方法

蛋白质构象的原子水平信息对于基于结构的药物设计至关重要。高分辨率蛋白质结构可通过X射线晶体学、NMR方法或计算方法获得。如果蛋白质结构不可用,但已知序列的同源蛋白的结构可以使用同源模建。实验蛋白质结构的最重要的公共存储库是RCSB蛋白质数据库。

基于实验研究得到的蛋白质模型的模拟具有原始数据的错误,数据集中的错误限制了后续建模的准确性,与所应用的技术无关。因此,蛋白质模型的质量评估对进一步的结果有重要的影响。在X射线实验的情况下,用傅里叶逆变换推导出电子密度。因此,电子密度图包含关键信息。结构的分辨率(Resolution)是广泛使用的全局描述符,定义了可以在特定实验中解决的原子对象的特定大小限制。结构模型的质量可以通过量化测量数据与模型预测数据之间的差异的R因子进行评估,故较低的R值表示更一致的模型,优化过程中的交叉验证是为了避免过度拟合数据。

A.能量评估的基本方法

量子力学(QM)在计算过程中要明确表示核和电子,因此解决核心是时间依赖性的薛定谔方程完全描述了所研究的分子的性质和能量。分子力学(MM)模型的原理是系统的能量仅依赖于核的构象,电子的作用是用简单的函数建模的。由于分子力学计算的速度,它是模拟蛋白质结构和结合配体的关键方法。水合效应可以通过隐式溶剂化或使用显性水分子纳入模型。

混合QM/MM方法采用两种方法来模拟基本生物过程的优点是具有嵌入蛋白质结构或溶剂环境中的电子的精确建模的基本贡献。典型如酶催化反应,在这些计算过程中,使用QM方法对电子细节感兴趣的次区域进行建模,而使用快速MM方法计算系统的其余部分。以CYP家族为例,催化中心由血红素铁和卟啉结构构成,其中卟啉结构协调分子氧形成高反应性化合物,电子和空间因子都具有重要作用。因此,催化反应的原子级解释需要使用混合QM/MM方法。

B.分子动力学(Molecular Dynamics)

蛋白质的构象动力学和功能之间存在重要的协同作用。分子动力学模拟将结构和动力学联系起来,以探索蛋白质分子可以获得的构象能量景观,促进原子水平理解蛋白质如何工作的原子细节。分子动力学模拟通过整合牛顿运动定律来计算系统的连续配置。记录的轨迹指定系统中颗粒的位置和能量作为模拟时间的函数。

分子动力学模拟在ADMET相关蛋白建模中具有重要的作用,例如探索柔性蛋白质的蛋白质构象或使用自由能微扰(free energy perturbation ,FEP)法计算ΔΔGbind。

2.同源建模

尽管蛋白晶体结构快速生长,但是已知蛋白质的数量仍然大大超过相应结构数量。另一方面,蛋白质的结构仅由其一级序列决定;进化过程中,序列变化不会直接转化为重要的域结构变化。具有高序列相似性的已知结构采用大致相同的结构模型,同源模建就是基于这些基础研究。

同源建模包括四个主要步骤:

(i)折叠分配;

(ii)序列比对;

(iii)模型构建;

(iv)模型优化。

没有可用3D结构的已知序列称“靶”,具有可用结构的顺序同源蛋白被称为“模板”。折叠分配的目标是基于与目标序列的序列相似性来识别可能的模板。选择正确的模板对预测模型的质量有重要影响;另一方面,参与ADMET建模的许多蛋白质都采用不同的构象。在CYP酶家族中,根据共结晶配体的存在和类型,活性位点在同种类型的晶体结构之间存在巨大的变异性。

模型建立过程通常包括构建骨架,随后构建同源模型的侧链。恢复模板中保守区域的构象,优化步骤的主要目的是提高生成的粗糙模型的有效性。可以进一步的环重建、能量最小化或分子动力学模拟。优化步骤中,模型的质量通过立体化学参数(如Ramachandran-plot,基于统计的电位和基于物理的能量函数)不断监测。

 

3.分子对接

对接是预测蛋白质活性位点内配体结合构象以及结合自由能的一种方法。为了预测结合模式,要对分子的内部构象和六个平移和旋转自由度进行采样。

配体-蛋白复合物的预测有两种不同的应用:

首先,研究单个配体-蛋白质相互作用以及精确结合自由能的预测,或为分子动力学或QM/MM计算准备分子结构需要的高度准确的模型。在这些情况下,两个约束伴侣的构象被认为是灵活的,因此对接研究是计算密集型的。

第二个应用是虚拟筛选。由于结合位点的高度灵活性和相关的采样计算成本,在大多数高通量对接方法中,蛋白质被认为是刚性的。因此虚拟筛选的对接被实现为在刚性蛋白质结合位点的边界内的配体的特殊构象搜索。

4.总结

具有或不具有结合配体的蛋白质结构模拟对于解释蛋白质功能的生物化学和生物物理学研究的结果具有根本的重要性。

由于建模依赖于实验数据,故理论和实践必须相互渗透。大概的模型可以是非常有用的工具来设计新的实验条件来测试各种假设。实验获得的结果可以指导反馈微调计算模型。除了计算机和体外技术之间的协同作用以了解许多生物现象的复杂性之外,蛋白质建模对药物发现有直接的影响。由于对蛋白质结构的了解不断扩大,ADMET相关靶标将成为近期计算机辅助药物设极具吸引力的领域

 

参考资料:

1.Warren G L,Do T D,Kelley B P,et al.Essential considerations for using protein–ligand structures in drug discovery[J].Drug Discovery Today,2012,17(23):1270-1281.

2.Mulholland A J.Computational enzymology:modelling the mechanisms of biological catalysts[J].2008.

3.Pisani P,Caporuscio F,Carlino L,et al.Molecular dynamics simulations and classical multidimensional scaling unveil new metastable states in the conformational landscape of CDK2[J].PloS one,2016,11(4):e0154066.

4.Moroy G,Martiny V Y,Vayer P,et al.Toward in silico structure-based ADMET prediction in drug discovery[J].Drug discovery today,2012,17(1):44-55.

5.Schmidt T,Bergner A,Schwede T(2013)Modelling three-dimensional protein structures for applications in drug design.Drug Discov Today.