
《数据挖掘与大数据分析》实验报告——数据预处理阶段
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本实验报告聚焦于《数据挖掘与大数据分析》课程中数据预处理阶段的关键步骤和技术应用,包括数据清洗、集成、变换和减少等环节,以确保后续的数据分析过程高效准确。
本实验报告采用的数据集来自机器学习库UCI的“心脏病数据库”。该数据集收集自克利夫兰诊所基金会、匈牙利心脏病研究所、加州长滩退伍军人管理局医疗中心以及瑞士苏黎世大学医院。UCI提供了两个版本的数据集,一个包含所有76个原始属性,另一个仅包括过去实验中实际使用的14个属性。本次实验选择了后者,共包含了303条数据记录。
报告内容涵盖数据清洗(如处理缺失值、异常值和噪声)、数据归约(通过特征选择和PCA进行维度减少以及样本抽样)及各种距离计算方法的介绍与应用。
全部评论 (0)
还没有任何评论哟~


