
Ant_Tianchi_CCF_Positioning: 2017 CCF 大数据与计算智能大赛 - 蚂蚁金服 商铺定位赛题 (荣获全国第五名)
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
在2017年CCF大数据与计算智能大赛中,参与蚂蚁金服举办的商铺定位挑战并取得了全国第五的好成绩。此赛事为提升数据分析和智能算法应用提供了广阔的平台。
2017 CCF 大数据与计算智能大赛 - 蚂蚁金服 - 商铺定位赛题(第5名)
文件说明:
getFeatures.sql 是用于二分类部分的预处理及生成特征中间文件,之后在PAI平台上搭建组件将每个特征文件和构建的样本进行join操作。多分类部分由队友负责。
wifiFingerprint.ipynb 是初赛阶段使用Python版本来构建指纹库并计算指纹得分,在复赛中通过Java实现在udtf(用户定义函数)中实现。
udtf 包含了getFeatures所使用的几个方法。
xgb_train.sql 在PAI平台上执行XGBoost命令,因为平台没有提供XGBoost的拖拽组件,只能使用PAI命令来运行。
submission.sql 用于提交结果部分,包括最佳成绩加权平均。
训练说明:
7月1日至8月17日的数据用于统计8月18日至31日期间的样本。7月15日至8月31日的数据用于构建9月1日至9月14日测试集的统计数据。
复赛阶段有大约38%的数据缺失。
全部评论 (0)
还没有任何评论哟~


