
糖尿病遗传风险预测的数据挖掘与机器学习挑战赛(含数据集,讯飞开放平台)
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本挑战赛聚焦于利用数据挖掘及机器学习技术评估个体患糖尿病遗传风险。参赛者将基于科大讯飞提供的相关数据集进行模型训练和优化,旨在提升对糖尿病遗传倾向的预测准确率。
赛题数据包括训练集和测试集两部分:
- 训练集:包含5070条记录,用于构建预测模型。
- 测试集:包含1000条记录,用于验证模型性能。
训练集中每个样本有9个字段信息:
- 性别、出生年份、体重指数、糖尿病家族史、舒张压数值、口服耐糖量测试结果、胰岛素释放实验数据、肱三头肌皮褶厚度测量值和患有糖尿病标识(即标签)。
在此基础上,提供了两种训练策略的机器学习代码供参考:
- 官方示例代码
- 决策树实现代码
适用人群:适合初学者使用,帮助他们掌握数据挖掘及机器学习的基本技能。
全部评论 (0)
还没有任何评论哟~


