抗乳腺癌活性化合物的ADMET性质预测模型

为提升抗乳腺癌药物虚拟筛C59研究购买选过程中吸收(absorption)﹑分配(distribution)﹑代谢(metabolism)、排泄(excretion)﹑毒性(toxicity)等属性的预测能力,提出一种抗乳腺癌药物定量结构-ADMET性质预测模型.首先,从化合物的分子描述符数据中遴选出对ADMET性质具有影响的3寻找更多19个特征变量;然后,以逻辑回归(Logistic Regression,LR)、朴素贝叶斯(Na?ve Bayes,NB)、梯度提升决策树(Gradient Boosting Decision Tree,GBDHepatic angiosarcomaT)作为ADMET分类预测的候选模型,筛选出GBDT模型为最优模型;最后,针对GBDT模型训练成本较高的问题,借助概率代理模型拟合超参数与预测精度之间的关系(即黑箱模型)构建GBDT*模型.结果显示,GBDT*集成学习模型整体表现最优,准确率、精准率、灵敏度、AUC指标分别达90%、88%、89%、0.95以上,误报率低于15%,表明GBDT*集成机器学习模型在抗乳腺癌活性化合物的ADMET性质预测方面具有良好的性能.