基于机器学习的社区老年人跌倒风险预测模型的构建

目的:了解社区老年人跌倒的发生状况,分析社区老年人跌倒发生的影响因素,描述分析社区老年人跌倒与其影响因素的关获悉更多系,根据其影响因素基于3种机器学习算法构建跌倒风险预测模型,并进行模型评价选出最优模型,为社区老年人跌倒的早期预防和干预提供评估工具。方法:(1)确定检索词,通过文献回顾的方法检索中英文数据库,从既往文献中获得社区老年人跌倒的影响因素。(2)将总结的影响因素自行设计为函询量表,通过德尔菲法进行专家函询,以专家积极系数、专家权威系数、专家协调系数和条目保留标准为依据对条目进行处理,形成社区老年人跌倒风险因素调查问卷。(3)通过问卷调查法对长春市某些社区的383名老年人进行评估和信息获取,建立数据集,使用SPSS 25.0对收集的资料进行统计描述和分析,经单因素分析后得出P<0.05的变量作为模型的预测变量。(4)以跌倒为结局事件,采用机器学习算法,通过Anaconda基于逻辑回归(logistic)、支持向量机(support vector machine)和随机森林(random forest)bone marrow biopsy构建社区老年人跌倒风险预测模型,使用5折交叉验证法搜寻最优参数,通过AUC值(ROC曲线下面积)、准确率、精确率、敏感度、特异度和F1值对模型进行评价,选出最优模型。结果:(1)文献回顾得到社区selleck激酶抑制剂老年人跌倒的影响因素包括社会人口学特征、疾病因素、药物因素、心理因素、生理因素、居家环境因素6个维度63个影响因素。(2)第一轮专家积极系数为73.3%,第二轮专家积极系数为100%:专家权威系数为0.96;第一轮专家协调系数为0.428,第二轮专家协调系数为0.477。通过对条目进行增加、删除和修改,形成包括年龄、性别、视力等58个因素的社区老年人跌倒风险因素调查问卷。(3)本研究纳入的383例社区老年人中,发生的跌倒的有75例,跌倒发生率为19.6%,经单因素分析发现年龄、内分泌代谢类疾病、跌倒恐惧等17个因素具有统计学差异并纳入预测模型特征变量。(4)RF模型对社区老年人跌倒风险分类的AUC值达到0.70,准确率=70.0%,精确度=22.2%,灵敏度即召回率=16.0%,F1值=0.19;SVM模型AUC值达到0.68,准确率=73.0%,精确度=33.0%,灵敏度即召回率=24.0%,F1值=0.28;LR模型AUC值达到0.69,准确率=70.0%,精确度=38.2%,灵敏度即召回率=66.0%,F1值=0.47。特征重要性分布提示神经系统疾病、年龄、听力等因素在逻辑回归模型预测社区老年人跌倒风险的过程中,对是否跌倒正确分类均显示出明显的重要性。结论:(1)社区老年人跌倒发生率为19.6%,跌倒发生率较高,社区医务人员及老年人家属应密切关注老年人跌倒的发生。(2)通过最优模型的分析特征重要性排序发现社区老年人发生跌倒主要与神经系统疾病、年龄、听力、衰弱情况、夜尿次数、循环系统疾病、营养及补充、用药数量、患病数量等17个因素密切相关,其中神经系统疾病对社区老年人跌倒的发生影响最大。