
加利福尼亚住房数据集:利用机器学习模型进行数据分析及源码分享
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目基于加利福尼亚州的住房数据,运用多种机器学习算法构建预测模型,并公开相关代码以供参考和交流。
加州住房数据集利用了机器学习模型来预测该地区房屋的中位数价值特征。我们采用了三种算法:线性回归、XGBoost以及TensorFlow/Keras神经网络进行建模。在训练这些模型之前,进行了要素工程处理,包括Z分数归一化、对数缩放、添加新的元素(例如总卧室与总房间的比例)、删除不必要的元素和合并相关特征,并且还考虑了经度和纬度的交叉。
针对这三种算法,我们使用不同组合的工程特征绘制R平方图以评估模型的有效性。接着,通过图形编辑这些图表以便于比较各个算法的表现。每种算法都提供了一组对应的图例来解释数值与一组特定的工程特征之间的关系。在提供的机器学习脚本中也包含了相应的图例信息,例如XGBoost中的“1:无特征工程”对应的是文件夹内名为“californiaHousingXGBoost1.py”的脚本。
R平方图表被存储于每个算法对应的主目录内的子目录图之中。对于每一组特定的工程处理集合,都提供了单独的.svg格式图形以供参考和分析使用。
全部评论 (0)
还没有任何评论哟~


