微信学术交流群之聊天记录(4)

微信学术交流群之聊天记录(4)

 

Docking

A:用的cdocker将晶体复合物的配体对接回原来的蛋白质重合度不好啊,rmsd也比较高,请问大家对接时受体蛋白加力场吗?

B:参数没设置好吧。

C:要分析原因哦。

(1)是所有对接计算出来的pose都不好?

(2) 还是打分最好的那个不好,打分差的反而好?

(3)还是根本没有生成活性构象。

如果生成了活性构象,而打分函数没有把他挑出来,说明打分函数有问题,需要换一个打分函数。如果根本没有摆出正确pose,需要改变搜索策略。或者干脆换软件。

活性预测

D:我现在自己做小分子活性预测的深度学习,在建模的过程中有个问题,训练集多少比较合适?

C:深度学习以不过拟合为准,同一个靶标的QSAR估计你要几千个数据点,我做过的都有6000,7000,8000或更多以上。

D:这个训练集您是以什么标准筛选的,有什么数据库吗?

C:开源的有pubchem,chembl,bindingdb。

D:他的活性值在这些数据库都有吗?需要爬虫下来?

C:不需要爬虫啊, 直接可以按靶标搜索。

E:现在什么靶标比较火呀,我也做的深度学习的,描述符有很多。

殷赋科技:不应该选经典成熟的靶标么?

E:用二维描述符+卷积神经网络。哪个靶标有一万以上的小分子呢?

C:毒性,代谢是所有药物上市前都研究的,这些靶标比较多,比如hERG。

蛋白处理与分子对接

A:请问如果是锌结合的抑制剂对接完成后做QM/MM除了将配体,锌离子以及与锌离子直接相连的三个氨基酸设为QM区,那些与配体成氢键或是pi作用的氨基酸也要设为QM区吗?

E:是的。

A:还有请问对于配体的电荷怎么看啊?比如一个羧酸分子,是0吗?

E:羧酸有H吗?有H就是0。

A:请问什么叫有氢吗?我加了charmm力场,羧酸那个O上面没有H。

E:那是-1,你的qm是dft还是dftb?

A:我不懂,怎么看啊?我是在ds里做的。

E:我以为你是qm/mm/md!

A:不是,没有做分子动力学。你好,我的配体就是这样的。

A:这个就算做-1是吗?还有请问组氨酸电荷是不是+1呢?我天冬氨酸按照-1算的。

E:HID,HIP还是HIE?看你质子化情况。

A:HIS。怎么看质子化啊?我是小白就是按教程做的。

殷赋科技:让DS处理吧。用UCSF Chimera的Prep Dock就可以处理,我们平台也会自动处理蛋白,生成的mol2文件就含有质子化氢和偏电荷(partial charge)。

F:你用什么做QMMM?

A:你好,我用的ds@F。下载的pdb晶体里面有一个配体很大,为了对接,清理蛋白质的时候定义活性位点设定的半径要不要相应增大啊?

G:不知道具体的结合位点?

A:我就选中的原来配体设定的半径。

H:原来的配体就是活性位点,一般半径设置10左右吧,半径太大的话对接时间会长,另外结果不准确,当然半径太小会对接不进去,可以适当调整。

A:你好,我看教程也是说半径设为10但是10的话我看无法全部包括原来的配体分子啊。

H:你可以适当增大,12也可以。

I:你们用的什么软件?我之前对接一个蛋白,用的原配体口袋,对接我的化合物打分挺高的,可是作用的氨基酸跟文献差好多,这正常么?

A:ds,我主要是现在想要选一个好的晶体,把自带的配体对接回去和本身的配体重叠查看一下rmsd值。

G:就是对接出来的结果不是那么准确吧。

A:好多晶体对接回去都不好,我现在调大点半径试试,先对上再说。

I:我之前用薛定谔对接的效果不错。

A:我感觉你那种情况好像也挺正常,这种对接也不怎么准,尤其是ds。

I:后来用的DS对接效果一般,但是作用的蛋白跟我用薛定谔对接的差不多。

A:薛定谔好像是更靠谱一些。

I:做起来挺慢的。

A:你们有薛定谔的教程吗?

I:我是跟别人学了两天,也没太搞明白。原来学校有个课题组做这个方向的,我毕业走了,我们学校开始开的计算机辅助药物设计这门课了!

QSAR叠合构象

R:请问,做QSAR分子叠合的时候,有些叠合的不好该怎么搞呢,明明都差不多。殷赋科技:你指的是QSAR模型的预测能力不好吧?如果叠合不整齐,手动调整咯。

R:你是说调训练测试集嘛?

殷赋科技:你是说结构叠合得不好(不整齐)吗?还是叠合后做出来的模型预测能力不好?

R:叠合出来的预测能力还行 confa的0.6几,comsia的有0.7几,就是叠合的不整齐。

殷赋科技:截图看如何不整齐。

殷赋科技:你是不是认为有部分结构应该左右反过来叠合才算整齐?

R:反倒是没反。

殷赋科技:那就没问题啊。

G:这是什么软件啊?

殷赋科技:SYBYL。

R:有几个明明就一点差别,但是叠合出来就重合的不好。

殷赋科技:那是构像问题了,它已经尽力了,但叠合是刚性的,构像如此,它也很无奈啊。调整构像呗,可以用你认为合适的某个化合物来构建相似结构的结构,构像就接近啦。

殷赋科技:或者产生大量构像,然后用算法去挑选。我不知道SYBYL里边有没有这个功能。

R:我刚看了教程找到了你说的利用构象搜索去挑选叠合构象@殷赋科技 感谢你的提醒。

虚拟筛选

S:导师让我做虚拟筛选这块儿(学autodock) ,但是没有头绪,我也不怎么会python,请问有这方面的课程么?

殷赋科技:我们博客上有个脚本,可以用用,不过,并不建议新手去用脚本做筛选。因为计算不是问题,问题是没有经验的人的命中率很低,浪费的是买化合物做实验的钱。

S:有道理,之前同组的同学用svm筛选过酪氨酸酶抑制剂,酶一点点花了八千多。

殷赋科技:我们正在开发在线方案,联合使用vina和dock6对接,再加上根据以往经验写成的分析筛选脚本,能极大提高命中率。如果不着急,不妨等一等。

D:您说的基于Vina和dock6对接,然后经过分析后得到数据的脚本,这个分析是什么个过程?共同命中被选下来?这个的话脚本不难写,如果这个思路可行的话我也想写写试一试。

殷赋科技:主要是两步,一是根据打分挑选最好的化合物,二是根据结合模式挑选,前者容易实现,后者则比较困难。

D:结合模式的话会把关键氨基酸以及结合对关键氨基酸的影响考虑进去吗?

殷赋科技:对,分为一般相互作用(比比如氢键、pi-pi堆积)和特殊相互作用(针对该体系的关键氨基酸及其作用),还有口袋形状的匹配程度HH。

靶标预测图

G:大家有预测疾病靶点的那种图吗?我写东西想用用。但是找不到啊。

F:举个例子?

K:什么样的图?

殷赋科技  :大概要个网络图吧。

G:对就是网络关系那种。

G:不用显示具体的物质。我就是想用一下这样的图。说明一下预测靶点。

殷赋科技:化合物在中间,周围是潜在的蛋白靶标,远近表示可能性大小。http://aAs.cytoscape.org/media/golorize/screenshots/Golorize.jpg

更多资讯,请登录www.yinfotek.com 或关注微信公众号“殷赋科技”。我司建立了微信学术交流群,为生物医药领域的朋友搭建沟通交流的互动平台。想入群的朋友,请在微信公众号菜单栏输入“加群”,根据提示操作即可。