有关UCSF DOCK6、AUTODOCK 与AUTODOCK VINA对接准确率的探讨

有关UCSF DOCK6、AUTODOCK 与AUTODOCK VINA对接准确率的探讨

 

以下是我司精选的微信群聊天记录,想加入微信学术交流群的朋友,请在公众号“殷赋科技”首页输入“加群”,验证后入群。

 

1

A:有没有关于主流对接软件的横评的综述啊,我看很多CNS级别的文章也在引用autodock还有vina,对接的准确与否一般是怎么定义的呢?

殷赋科技:这样的文章(文献)有很多,到pubmed搜一下就有了。之前群里有人发了一篇文章,说到vina的准确率比dock6高。我对此持怀疑态度。我只凭经验判断,没有重现过人家的结果,也没有去仔细研究人家的研究过程。

有两个方面,我认为dock6更好:

1、做过不少体系,dock6的结果更接近晶体构象或者能够解释实验现象,而vina则不太行。比如,我以前在做教程的时候,同一个PDB蛋白用dock6只产出少量(经常是一两个)pose结果,且第一个(也就是打分最好的)结果与实验晶体结构非常一致,而用vina则产生很多结果,没有一个好的。当然,并不是说vina对所有体系都没有好结果,只是我自己做的多了,渐渐发现dock6明显更可靠。这个比那些测评更实际。

2、dock6的打分与实验活性的相关性能够达到0.9,vina做不到,可能也就0.5。

 

A:0.9?这么高,可以啊,有文章发表这个结果吗?

殷赋科技:少量化合物可以做到。

 

A:我查的都比较老了,有一篇13年的横评,还有一篇比较新的18年JCIM的综述里我没有dock6。文章里gold的结果是比较好的,我不知道是不是dock6有别的名字。

B:我也用过autodock,个人也觉得精度不太高。。。

殷赋科技:dock6通常写作DOCK6或者UCSF DOCK6,以下只是最近做的结果。我做的这个结果并非一帆风顺,而是在研究结合模式和猜测机理解释实验现象的情况下反复调试出来的。它不光是打分数据好看,而且能够完美解释现象。就差客户做实验验证了。

殷赋科技:你这篇文献没有dock6。另外,这是虚拟筛选,跟结合模式预测有些不同。虽然都是对接,但是处理方式不同。虚拟筛选是对大量化合物进行对接,那么,这些化合物能否精细处理,结构有没问题,这是个问题。然后,对接结果只输出一个构象(pose),但我们知道,对接结果中第一个结果未必就是最好的。

我说dock6更准确,指的是它在预测化合物的结合模式与结合力上更好。但结合模式不对,也能在虚拟筛选上获得不错的成绩。所以这两者是有区别的。

 

C:请问下打分和实验结果的相关性是怎么做的呢?

殷赋科技:将对接打分(比如Grid Score)和实验活性(比如,pIC50)做直线回归。

 

A:结合模式大部分不都是通过人为去判定的吗?一般输出多个pose,根据聚类和预测的机理去选择合适的构象。

对接本身大部分用的是晶体结构,也不考虑溶剂化效应,本身粗糙的模型做精细化的考虑是不是效果也有限啊。

 

殷赋科技:对啊,这就有意思了。

1、因为涉及到人的判断,需要参考更多信息(最好是实验方面的),所以,不能完全相信文献的测评结果;

2、效果肯定是不能非常精确,但定性判断结合模式就足够了,而定量方面,也不要要求太高,通过回归分析,就能避免系统性错误,其他的错误也只好承认无能为力。

 

没有考虑溶剂化效应所带来的不准确,是可以通过回归拟合来消除一部分的。

对于结合模式预测来说,正确或接近正确的结合模式是第一位,其次是结合力,如果想要更准确的结合力,用分子动力学+MM/PBSA,或者FEP、QM/MM。

 

2

A:请问小分子化合物的氮原子的质子化状态跟哪个参数有关系呀?

B:pKa,这个东西不需要预测,只需要去查与你化合物片段最接近化合物的实验pKa就可以。有很多预测软件,商业化学信息学软件:ChemAxon,ACDLABS/pKa, OpenEye/pKa prospector,还有Moldiscovery的pKa预测。自己愿意折腾,用QM方法计算也可以。

 

A:sybyl里配体准备和优化那块有相关的吗,我是做配体准备和优化然后叠合做3DQSAR,需要考虑质子化状态吗?

B:可能不会影响模型的统计学指标(Q^2/R^2), 但是会影响对QSAR的解读。

 

A:请问QSAR的话sybyl里没有跟质子化状态相关的参数是吗?只能用预测软件是吗?

B:ZINC可以根据靶标的特点,下载不同pH范围进行离子化状态预处理好的3D结构。如果虚拟筛选。不想自己处理,直接在ZINC上下载就好了。ZINC可以根据你需要的化学空间位置来下载。

 

A:恩恩,做构效关系用的是特定的一系列化合物还能这么做了吗?

B:QSAR,如果是一类化合物,知道一个就知道全部。免费的pKa查询:http://chemlab.sioc.ac.cn/pKapred/index.php。

pKa的文献非常多,找一个结构跟你需要的知道那个差不多的化合物,看看实验值是多少,直接套用这个就可以。

 

3

A:请问利用Gromacs来跑分子动力学,除了用CGenFF 来生成小分子的拓扑结构,还有什么在线网站可以生成小分子的拓扑结构文件?

B:http://chemlove.gitlab.io/creat-topol-file-in-gmx/。

C:请教各位一个问题,你们知道有什么预测药物在体内的代谢产物的预测软件或者webserves吗?

D:admet predictor。

E:请问做小分子ADMET预测,用什么软件比较好?有没有免费的,或者便宜一点的?

F:DS可以做ADMET预测啊。

G:怎么用gaussian怎么算自由能,熵变,焓变?

H:简单来说就是ZPE+△G (H)+£e,热力学校正+单点能就是G(T),可以在低级别下计算校正量,在高精度下算电子能,最有性价比的方法。

I:怎么可以实现批量讲sdf文件转化成mol2文件。

J: Python split。

K:格式转化,试试openbabel。

 

我司推出殷赋云平台-分子对接方案,智能化预测蛋白与小分子结合位点,详情:http://www.yinfotek.com/platform