Advertisement

Ant_Tianchi_CCF_Positioning: 2017 CCF 大数据与计算智能大赛 - 蚂蚁金服 商铺定位赛题 (荣获全国第五名)

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:ZIP


简介:
在2017年CCF大数据与计算智能大赛中,参与蚂蚁金服举办的商铺定位挑战并取得了全国第五的好成绩。此赛事为提升数据分析和智能算法应用提供了广阔的平台。 2017 CCF 大数据与计算智能大赛 - 蚂蚁金服 - 商铺定位赛题(第5名) 文件说明: getFeatures.sql 是用于二分类部分的预处理及生成特征中间文件,之后在PAI平台上搭建组件将每个特征文件和构建的样本进行join操作。多分类部分由队友负责。 wifiFingerprint.ipynb 是初赛阶段使用Python版本来构建指纹库并计算指纹得分,在复赛中通过Java实现在udtf(用户定义函数)中实现。 udtf 包含了getFeatures所使用的几个方法。 xgb_train.sql 在PAI平台上执行XGBoost命令,因为平台没有提供XGBoost的拖拽组件,只能使用PAI命令来运行。 submission.sql 用于提交结果部分,包括最佳成绩加权平均。 训练说明: 7月1日至8月17日的数据用于统计8月18日至31日期间的样本。7月15日至8月31日的数据用于构建9月1日至9月14日测试集的统计数据。 复赛阶段有大约38%的数据缺失。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • Ant_Tianchi_CCF_Positioning: 2017 CCF - ()
    优质
    在2017年CCF大数据与计算智能大赛中,参与蚂蚁金服举办的商铺定位挑战并取得了全国第五的好成绩。此赛事为提升数据分析和智能算法应用提供了广阔的平台。 2017 CCF 大数据与计算智能大赛 - 蚂蚁金服 - 商铺定位赛题(第5名) 文件说明: getFeatures.sql 是用于二分类部分的预处理及生成特征中间文件,之后在PAI平台上搭建组件将每个特征文件和构建的样本进行join操作。多分类部分由队友负责。 wifiFingerprint.ipynb 是初赛阶段使用Python版本来构建指纹库并计算指纹得分,在复赛中通过Java实现在udtf(用户定义函数)中实现。 udtf 包含了getFeatures所使用的几个方法。 xgb_train.sql 在PAI平台上执行XGBoost命令,因为平台没有提供XGBoost的拖拽组件,只能使用PAI命令来运行。 submission.sql 用于提交结果部分,包括最佳成绩加权平均。 训练说明: 7月1日至8月17日的数据用于统计8月18日至31日期间的样本。7月15日至8月31日的数据用于构建9月1日至9月14日测试集的统计数据。 复赛阶段有大约38%的数据缺失。
  • 2018脑竞目分享
    优质
    本视频为2018蚂蚁金服金融大脑竞赛的相关内容分享,深入解析比赛题目与规则,探讨金融科技的实际应用挑战及解决方案。 2018年蚂蚁金服金融大脑赛题分享的内容包括了比赛的相关细节和技术挑战的介绍。此次赛事旨在促进金融科技领域的创新和发展,吸引了众多参赛者积极参与。通过这次比赛,参与者有机会展示自己的技术实力,并且能够深入了解蚂蚁金服在智能金融服务方面的研究和应用。
  • 2020 CCF NER:非结构化业文本隐私信息识别方案
    优质
    本作品参加了2020年CCF举办的NER竞赛,在非结构化商业文本隐私信息识别赛道中取得了优异成绩,位列第七。我们团队创新性地结合了深度学习技术与自然语言处理方法,有效提升了敏感信息的精准定位和分类能力,为数据安全领域贡献了一套高效、可靠的解决方案。 2020 CCF-NER 大赛中的非结构化商业文本信息中隐私信息识别任务获得了第7名的成绩。该方案采用 BERT base 模型结合 flat 结构以及 CRF 层,并应用了 FGM、SWA 和 PU learning 策略,同时使用 CLUE 数据集进行训练和测试。在 test1 单模条件下达到了 0.906 的表现。 词向量采用了 SGNS(Mixed-large 综合) 方案,损失函数及掩码处理的相关代码实现了 PU learning 策略的主要模块版本。所用的软件环境为:Python 3.6.9、torch 1.1.0、transformers 3.0.2、pytorchcrf 1.2.0 和 torchcontrib 0.0.2。
  • CCF-BDCI-互联网融新实体识别-九届.zip
    优质
    本资料包包含第九届CCF-BDCI大赛中“互联网金融新实体识别”挑战任务的相关数据和文档。参赛者需利用自然语言处理技术,从文本中精准定位并分类出新的金融相关实体。 CCF-BDCI大数据与计算智能大赛-互联网金融新实体发现-9th.zip
  • 届“新陆杯”中机设人工道预选
    优质
    新大陆杯中国计算机设计大赛的人工智能赛道预选赛迎来其第十五届盛会,本次赛事聚焦于推动人工智能领域的创新与实践,吸引了众多高校学子积极参与。 PyTorch模型、ONNX模型、RKNN模型、检测代码以及模型转换代码。
  • CCF-个贷违约预测.zip
    优质
    本资料包包含CCF大数据与计算智能竞赛中关于个贷违约预测的相关数据和文档。参赛者将运用机器学习算法分析海量信贷信息,构建模型以预测个人贷款的违约风险。 CCF大数据与计算智能比赛中的个贷违约预测项目正在进行中。参赛者需要利用提供的数据集来建立模型,以准确预测个人贷款的违约情况。这是一个很好的机会,让参与者展示他们在数据分析、机器学习以及风险评估方面的技能。
  • 职业技道电分析
    优质
    本赛事聚焦大数据技术在电商领域的应用,挑战者需运用分析技巧解决实际问题,旨在培养和选拔顶尖数据分析师。 shtd_store的数据表包含全国职业技能竞赛的电商数据,你可以将它导入到你的数据库中进行练习。
  • 一届至学生GIS应用技
    优质
    本资料涵盖第一届至第五届全国大学生GIS应用技能大赛的全部赛题,内容包括数据集、任务说明及评分标准等,适用于高校地理信息科学及相关专业教学与实践。 由于数据量较大,将内容分成了几部分上传,请注意这是1-5届的试题。
  • 六届学生GIS应用技下午
    优质
    本资料包含第六届全国大学生GIS应用技能大赛下午场的比赛数据。涵盖地理信息系统的实际操作与分析能力考核内容。 目前共享单车越来越受欢迎,不仅解决了人们的“最后一公里”问题,还促进了健康生活方式的普及。然而,在实际运营过程中也暴露出一些挑战,比如车辆停放不当、管理混乱等问题日益突出。为此,相关企业发起了名为我的城市, 我的单车”的活动,并招募志愿者来协助管理和维护共享单车。 作为负责公司地理信息系统(GIS)的技术人员,我被要求根据提供的数据资料开发一款应用程序系统。该应用旨在帮助分配和追踪不同志愿者所管辖的具体区域范围,确保每位参与者能够高效地开展工作并及时反馈信息。具体的数据包括: - bikes.shp:记录了所有共享单车的位置分布情况。 - road.shp:提供了商业区内的道路网络布局。 - range.shp:界定了特定建筑物或区域内可以停放车辆的界限。 - volunteer.xls:列出了参与活动的所有志愿者名单及其基本信息。 通过这些数据,我们希望能够构建一个用户友好型平台,让每位志愿者都能够清晰地了解自己负责的具体区域,并且方便地进行日常巡查和管理。