三种机器学习算法预测心力衰竭死亡的价值研究
决策树,分类器,准确率
陈晓彤 岑梓熹 谭静仪 栾雅 彭师师 严波 何震


摘要:目的? 用机器学习三种不同算法建立心力衰竭分类预测模型,比较模型的准确率,并分析心力衰竭死亡事件重要性特征,对人群尽早发现和实施介入措施提供援助,努力提高人们的健康水平和生活质量。方法? 使用Kaggle平台发布的心力衰竭数据集,通过缺失值填充法、数据标准化处理、SMOTE方法进行数据预处理。基于随机森林、C4.5、AdaBoost算法建立心力衰竭预测模型。使用性能评估指标混淆矩阵、ROC曲线、均方根误差以及均值绝对误差评估评价模型性能。结果? PermutationImportance给出的变量重要性排序中,血清肌酐水平、年龄、血清钠离水平排序靠前。三种模型中,随机森林模型准确率为85%,精确率为81%,召回率为68%;C4.5模型准确率为83%,精确率为80%,召回率为63%;AdaBoost模型准确率为80%,精确率为71%,召回率为63%。结论? 基于所用数据集,随机森林模型优于C4.5模型与AdaBoost模型,心力衰竭死亡风险预测模型能为心力衰竭早期预防控制及诊断提供参考依据。
关键词:心力衰竭;死亡;预测模型;C4.5;随机森林;AdaBoost
中图分类号:R541.6? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文献标识码:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?DOI:10.3969/j.issn.1006-1959.2024.11.002
文章编号:1006-1959(2024)11-0011-05
Value of Three Machine Learning Algorithms in Predicting Death from Heart Failure
Abstract:Objective? To establish a classification and prediction model of heart failure by using three different algorithms of machine learning ......
您现在查看是摘要页,全文长 13916 字符。