
Kaggle Otto商品分类竞赛代码解析
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
本篇文章详细解析了在Kaggle Otto Group产品分类竞赛中的代码和技术细节,深入探讨了模型构建、特征工程等关键步骤。适合数据科学爱好者和参赛者学习参考。
在Kaggle Otto生产分类挑战赛(排行榜)中排名第85位(共3514名参赛者)。
特征工程:
- 每行所有功能的总和
- 每行所有功能的最大值与最小值之差
- 计算每行填充的特征数
- 在前20个特征上创建的操作特征,包括加、减、乘等运算(并非始终有效)
- 用均值标准化转换特征:新特征=原始特征 - 列均值
模型:
XGBoost
神经网络(使用Keras和H2O;最终合奏仅采用Keras模型)
随机森林
软件工具:
R语言版本3.1.3
相关R包:doParallel、dplyr、xgboost、party
Python 2.7版本
相关库:Keras、Numpy、Scipy
全部评论 (0)
还没有任何评论哟~


