
心力衰竭的预测,采用集成学习及 Spark 技术。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本研究的主要目标是能够基于患者的详细病历,自动预测未来一段时间内他们是否可能发展出心力衰竭,特别是充血性心力衰竭。为了达成这一目标,我们利用 ExactData 数据集包含的 10,000 余名患者的医疗记录,并构建了包含诊断信息、风险因素、用药历史以及实验室检测结果等特征的描述性变量。随后,我们采用集成机器学习方法对分类器进行了训练,主要运用逻辑回归和随机森林算法进行装袋技术。为了评估模型的性能并优化分类器参数,我们实施了 k 折交叉验证策略,借助 Spark 平台中的 ML 管道框架。实验结果表明,我们在一个由 50% 未患有心力衰竭个体和 50% 已被诊断为患有心力衰竭个体的测试集中,实现了超过 98% 的准确率水平,同时有效地控制了假阴性率。此外,我们对混淆矩阵进行了深入分析,并通过审视数据集潜在的偏差来阐述相关发现。该研究依赖于 Spark 1.3.0 和 MLlib 工具包。
全部评论 (0)
还没有任何评论哟~


