基于机器学习对乳腺癌超声图像数据分类

目的 探讨机器学习(Machine Learning)在乳腺癌超声图像数据分类中的应用价值。方法 使用Online Medical Images数据库中的超声数据,整理出727张超声影像数据,其中502张乳腺癌超声数据,225张健康人乳腺超声数据,将其数据维度统一设置为64×64大小。按照类别将60%的数据作为训练集数据,40%的数据作为测试集数据。通过支持向量机(Support Vector Machine, SVM)方法,选择不同特征向量对训练集进行模型训练,在独立验证集数据中验证模型性能,包括曲寻找更多线下面积(AUC)以及相应的灵敏度和特异性。结果 共找到291个特征向量,将其作为SVM的分类支持向量,将其中的197个特征支持向量作为肿瘤的特征支持向量,将94个特征支持向量作为正常的支持向量。对测试集数据进行分析,曲线下面积(AUC)为0.88,相应的灵敏度为90.31%,特异性为87.25%。结论 Physio-biochemical traits机器学习在乳腺癌超声图像数据分类中具有重要应用价值,具Baf-A1化学结构有较高灵敏度和特异性,适合推广应用。