Advertisement

Kaggle:各类 Kaggle 比赛的代码汇总

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
本项目汇集了来自Kaggle平台各比赛领域的优质代码和解决方案,旨在为参赛者提供学习资源与灵感。 Kaggle 上有各种比赛的相关代码。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • Kaggle Kaggle
    优质
    本项目汇集了来自Kaggle平台各比赛领域的优质代码和解决方案,旨在为参赛者提供学习资源与灵感。 Kaggle 上有各种比赛的相关代码。
  • Kaggle猫狗分数据集
    优质
    简介:Kaggle猫狗分类比赛数据集是由数千张猫和狗的照片组成的训练集,用于机器学习模型识别与分类图像中的动物类型。 这是Kaggle竞赛中的猫狗大战公开数据集,包含train和test文件夹及一个csv说明文件。由于在Kaggle上注册比较麻烦,并且下载速度较慢,有需要的可以寻找其他途径获取该数据集。代码获取方法可以在相关技术博客或论坛中搜索相关信息。
  • Kaggle-Cassava-Leaf-Disease-Classification:木薯叶病分Kaggle...
    优质
    这段简介可以这样写:“Kaggle-Cassava-Leaf-Disease-Classification”项目是一个针对木薯叶病进行分类的比赛代码,旨在通过图像识别技术帮助农民精准诊断作物疾病。 在Kaggle的木薯叶病分类竞赛中,“木薯叶病分类”项目取得了第256名的成绩(总排名为3900中的前7%),并获得了铜牌,比赛于二月份结束。最近整理代码后,我决定将其发布到GitHub上。(尽管整理代码是一项繁琐的工作)。在私有数据集中,我的模型得分为0.8987 。然而,在GitHub上发布的版本得分更高为0.9010 ,如果提交该解决方案,则可以进入银牌区域。 该项目的仓库包括训练和测试部分的完整代码。我使用了一些特定的技术来优化性能: - AMP(自动混合精度)以加快模型训练速度,考虑到Kaggle平台上的GPU时间限制以及我个人使用的较慢GPU。 - 数据增强技术Data8月被证明可以提升模型的表现;我没有采用cutmix或snapmix等方法,因为这些技巧虽然耗时较长但并未显著改善性能。 - K折交叉验证($ k = 5 $)用于模型训练和评估的稳定性 - 模型集成:EfficientB4是我自己训练的一个版本,而Resnext则是从讨论区获得公开访问权限后使用的。 以上就是我对该项目的一些说明。
  • Kaggle库:我参与分享
    优质
    本代码库汇集了我在Kaggle竞赛中的参赛作品和源代码,旨在为机器学习爱好者提供实践参考与交流平台。 Kaggle比赛代码仓库:此仓库包含我参加的多个Kaggle比赛的相关代码。 免责声明:部分代码完全由我自己编写,而另一些则是从其他Kaggle内核中获取灵感的结果。对于后者,我会明确标注,并且已经将这些借鉴的内容合并到我的仓库里。 回购结构: 01-TextNormalization: 竞赛相关链接请在原始文档查看。 包含的文件有:xgboost_class_predictions.ipynb(修改自LiYun的代码)使用XGBoost预测单词类型。例如,基数、序数和度量等; Create_function_classes.ipynb:我自己编写的脚本,创建了几个函数用于根据正则表达式处理不同类型的单词。这些功能包括罗马数字到整数转换、日期时间解析以及电话号码识别等等。此外,该文件还展示了如何使用上述“类”来对测试集中的单词及其类型进行预测和预处理。
  • 叶子分数据集 - Kaggle: Classify-Leaves
    优质
    Classify-Leaves 是Kaggle平台上一个专注于植物叶片图像识别的比赛数据集,旨在促进机器学习社区对植物物种自动分类的研究与应用。 Kaggle网站上有一个深度学习竞赛资源,涉及树叶分类的竞赛数据集。
  • Zillow房价估计-Kaggle
    优质
    本项目参加Kaggle比赛,旨在通过分析住宅属性数据来预测房屋价格,使用Zillow数据库,提升了对房地产市场及机器学习模型应用的理解。 Zillow是一家致力于为消费者提供数据支持的领先房地产和租赁市场平台,它涵盖了从购房、售房到租房、融资以及翻新等各种房屋生命周期的服务。“Zestimate”是Zillow对房产价值的一种评估方式,基于750万个统计与机器学习模型进行估算。每个属性上的数百个数据点被这些模型分析以得出结果。 2017年5月24日,Zillow在Kaggle平台上发起了一个竞赛,旨在改进其“Zestimate”模型的精确度。这次比赛吸引了众多数据科学家和算法专家参与,共同探讨如何更准确地评估房屋的价值。 对于普通人来说,在试图购买第一套房子时要回答“这间房子值多少钱?”这个问题可能会非常困难。虽然人们可以根据自己的预算来决定愿意为房产支付的价格,但实际价值还取决于市场状况、房屋的质量以及位置等多种因素。此外,“Zestimate”之类的估价也可能因评估者的不同而有所差异,例如贷款机构、房地产经纪人或县税务评估员给出的估值可能各不相同。 因此,在购买房产时了解准确的价值对于买家来说至关重要,并且需要综合考虑各种影响房价的因素来做出明智的选择。
  • 自行车共享:Kaggle
    优质
    本Kaggle竞赛聚焦于开发预测模型,旨在优化自行车共享系统的运营效率和用户体验,通过数据分析解决供需不平衡问题。 这段Python代码探索了Kaggle自行车共享需求竞赛中的几种基本机器学习方法。我撰写这篇文章是为了华盛顿大学Bill Howe教授的优秀Coursera“数据科学导论”在线课程的作业而写的。这是一个仅供娱乐和练习的知识竞赛,没有奖金。 该想法是根据天气、时间、温度以及是否为工作日等信息来预测一天中每个小时将租用多少辆自行车。这段代码允许用户指定Python库中的10种不同机器学习算法之一用于预测自行车需求。此外,用户还必须明确哪些数据变量应该被用来训练模型,并且可以选择是在完整的训练样本上进行训练以向Kaggle比赛提交预测结果,或者在所有可用数据的子集中进行训练和测试。 第一个选项会在完整输入的数据集上对模型进行训练,并将预测结果写入名为output.csv的文件中。这个文件可以直接上传到Kaggle竞赛平台。
  • Kaggle Otto商品分解析
    优质
    本篇文章详细解析了在Kaggle Otto Group产品分类竞赛中的代码和技术细节,深入探讨了模型构建、特征工程等关键步骤。适合数据科学爱好者和参赛者学习参考。 在Kaggle Otto生产分类挑战赛(排行榜)中排名第85位(共3514名参赛者)。 特征工程: - 每行所有功能的总和 - 每行所有功能的最大值与最小值之差 - 计算每行填充的特征数 - 在前20个特征上创建的操作特征,包括加、减、乘等运算(并非始终有效) - 用均值标准化转换特征:新特征=原始特征 - 列均值 模型: XGBoost 神经网络(使用Keras和H2O;最终合奏仅采用Keras模型) 随机森林 软件工具: R语言版本3.1.3 相关R包:doParallel、dplyr、xgboost、party Python 2.7版本 相关库:Keras、Numpy、Scipy
  • Kaggle脑电图检测:grasp-and-lift项目
    优质
    本项目为Kaggle脑电图检测比赛中grasp-and-lift项目的实现代码,旨在通过分析脑电数据预测抓取和提起动作。 Kaggle抓举检测此存储库中的代码可用于在Kaggle抓举式EEG检测比赛数据上训练和采样LSTM和CNN(相当实验)模型。我并不知道排行榜得分是多少,因为我忘记了报名截止日期...笔记这些模型可能表现不佳。我对信号处理和EEG领域了解不多,并且在此比赛中花费的时间不足,无法获得令人满意的结果。无论如何,这是一个学习LSTM如何工作以及如何使用python进行数据处理的绝好机会。 克隆存储库后,您应该运行setup.sh脚本,它将准备目录结构并预处理数据。随后应执行准备工作。主要脚本连接了两个其他脚本:do_subject.sh num用于主题编号num训练LSTM模型,并在验证集上对其进行评估;do_submission.sh分别针对每个主题训练LSTM模型,并生成验证和提交文件。 管道首先使用python脚本进行预处理,calc_mean_std.py应用低通滤波。