抗癌候选药物ERα抑制剂活性预测

乳腺癌是威胁全球女性健康最常见的恶性general internal medicine肿瘤.研究发现,雌激素受体α亚型(ERα)在乳腺的发育过程中起着重要的作用,被视为乳腺癌治疗的重要靶标,拮抗ERα活性的化合物可作为乳腺癌治疗CP-456773的候选药物.为有效预测小样本、多特征条件下的乳腺癌治疗靶标ERα的化合物生物活性,提出一种抗乳腺癌药物定量结构-活性关系预测模型Mul-BHO-Bi-LSTM.首先,对1 974个化合物的729个分子描述符信息进行描述性统计和多重共线性诊断,采用随机森林方法,筛选20个显著变量的重要性评分大于0.01的变量;然后,构建基于卷积神经网络的二维特征矩阵,采SB203580用贝叶斯超参数优化方法,对双向长短期记忆(bi-directional long short-term memory network,Bi-LSTM)模型进行超参数寻优;最后,对模型的预测效果进行分析评价.结果显示,相比梯度提升决策树(gradient boosting decision tree,GBDT)集成学习方法,MulBHO-Bi-LSTM模型的预测效果较优,模型误差相关指标MSE、NRMSE、error mean、error std均小于0.15,关联指标R2和r达0.99以上,表明Mul-BHO-Bi-LSTM的集成机器学习预测模型具有较好鲁棒性和泛化性,模型可为抗乳腺癌药物的筛选与设计提供方法.