机器学习服务

机器学习

Machine Learning

机器学习,排序处理

机器学习(Machine Learning, ML)最常用来分类,在各个领域都会用到。在药物设计领域,机器学习法常用于区分有无活性、预测化合物的活性等级(高、中、低、无活性)或活性值。当前,机器学习方法主要包括:朴素贝叶斯(naïve Bayesian)、支持向量机(support vector machine)、递归划分(recursive partitioning)和KNN法(k-nearest neighbors);等等。这些方法都需要一定的自变量和因变量为输入,输出为模型本身。

自变量用的最多的是化合物的各种性质,比如分子量、极性、分子体积、分子表面积、氢键给体受体等,也可以是能够描述分子的指纹信息(Fingerprint);因变量则为活性分类或活性值。自变量的选择往往决定了模型的质量,通常要求模型的准确度达到80%以上,数据集也通常划分为训练集(training set)、测试集(test set)、检验集(validation set)。机器学习的过程,实际上,仍然是人工建模过程,专家分析对于建立一个鲁棒(robust)的模型是必不可少的。

殷赋科技在机器学习研究方面有丰富的经验和领先的核心技术,为广大科研工作者提供高效高质量的技术服务,欢迎垂询!