Advertisement

Kaggle竞赛中的“木薯叶病分类”代码仓库。

  • 5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
Kaggle上的“木薯叶病分类”竞赛代码,该项目旨在对木薯叶病进行分类。 该竞赛于二月份结束,并获得了第256名的排名,最终获得铜牌(最高7%的准确率)。 在最近整理代码时,我决定将其发布到GitHub上(整理代码确实耗费了大量精力〜)。 在私有的数据集上,我取得了0.8987的准确率。 然而,这并非我最优的解决方案(或许成功的关键在于此...忍不住大笑)。 我在GitHub上发布的代码版本达到了0.9010的准确率;如果将此方案提交,预计该代码将进入银牌级别。 该仓库包含了训练模块和测试模块的代码,并且我运用了一些技巧来实现更高效的训练过程:AMP技术用于加速训练(考虑到Kaggle中的GPU时间限制以及我的GPU性能有限),同时数据在八月时可以提供更优越的表现(我选择放弃了诸如cutmix或snapmix等技巧,这些方法虽然耗费大量时间却未能显著提升性能)。 此外,我还采用了K折交叉验证模型合奏的方法,$k=5$ ,模型集合包括EfficientB4(由我自己进行训练)以及Resnext(在讨论区域中已开放访问)。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • Kaggle-Cassava-Leaf-Disease-Classification:Kaggle...
    优质
    这段简介可以这样写:“Kaggle-Cassava-Leaf-Disease-Classification”项目是一个针对木薯叶病进行分类的比赛代码,旨在通过图像识别技术帮助农民精准诊断作物疾病。 在Kaggle的木薯叶病分类竞赛中,“木薯叶病分类”项目取得了第256名的成绩(总排名为3900中的前7%),并获得了铜牌,比赛于二月份结束。最近整理代码后,我决定将其发布到GitHub上。(尽管整理代码是一项繁琐的工作)。在私有数据集中,我的模型得分为0.8987 。然而,在GitHub上发布的版本得分更高为0.9010 ,如果提交该解决方案,则可以进入银牌区域。 该项目的仓库包括训练和测试部分的完整代码。我使用了一些特定的技术来优化性能: - AMP(自动混合精度)以加快模型训练速度,考虑到Kaggle平台上的GPU时间限制以及我个人使用的较慢GPU。 - 数据增强技术Data8月被证明可以提升模型的表现;我没有采用cutmix或snapmix等方法,因为这些技巧虽然耗时较长但并未显著改善性能。 - K折交叉验证($ k = 5 $)用于模型训练和评估的稳定性 - 模型集成:EfficientB4是我自己训练的一个版本,而Resnext则是从讨论区获得公开访问权限后使用的。 以上就是我对该项目的一些说明。
  • Kaggle Cassava-Leaf-Disease:识别片图像
    优质
    本项目参加Kaggle竞赛,旨在通过深度学习模型分析和分类木薯叶病害图像,助力农业疾病预防与控制。 Kaggle任务是将每张木薯图像分为五类:表示植物具有某种疾病或健康叶片的状况。组织者提供了一个数据集,该数据集包含在乌干达定期调查期间收集的21,367张带标签的图片。这些照片大多数是从农民那里获取,并由国家作物资源研究所(NaCRRI)与坎帕拉马可雷雷大学AI实验室合作进行批注。 为了使用此功能的基本方法,可以尝试以下命令安装工具:`!pip install https://github.com/Borda/kaggle_cassava-leaf-disease/archive/main.zip` 在Colab中运行笔记本时,建议将数据集上传到个人Google Drive,并连接至该驱动器以避免重置Colab后重新上传数据。 一些结果展示了ResNet50模型经过10个周期训练后的进度。
  • Kaggle Otto商品解析
    优质
    本篇文章详细解析了在Kaggle Otto Group产品分类竞赛中的代码和技术细节,深入探讨了模型构建、特征工程等关键步骤。适合数据科学爱好者和参赛者学习参考。 在Kaggle Otto生产分类挑战赛(排行榜)中排名第85位(共3514名参赛者)。 特征工程: - 每行所有功能的总和 - 每行所有功能的最大值与最小值之差 - 计算每行填充的特征数 - 在前20个特征上创建的操作特征,包括加、减、乘等运算(并非始终有效) - 用均值标准化转换特征:新特征=原始特征 - 列均值 模型: XGBoost 神经网络(使用Keras和H2O;最终合奏仅采用Keras模型) 随机森林 软件工具: R语言版本3.1.3 相关R包:doParallel、dplyr、xgboost、party Python 2.7版本 相关库:Keras、Numpy、Scipy
  • Kaggle:我参与
    优质
    本代码库汇集了我在Kaggle竞赛中的参赛作品和源代码,旨在为机器学习爱好者提供实践参考与交流平台。 Kaggle比赛代码仓库:此仓库包含我参加的多个Kaggle比赛的相关代码。 免责声明:部分代码完全由我自己编写,而另一些则是从其他Kaggle内核中获取灵感的结果。对于后者,我会明确标注,并且已经将这些借鉴的内容合并到我的仓库里。 回购结构: 01-TextNormalization: 竞赛相关链接请在原始文档查看。 包含的文件有:xgboost_class_predictions.ipynb(修改自LiYun的代码)使用XGBoost预测单词类型。例如,基数、序数和度量等; Create_function_classes.ipynb:我自己编写的脚本,创建了几个函数用于根据正则表达式处理不同类型的单词。这些功能包括罗马数字到整数转换、日期时间解析以及电话号码识别等等。此外,该文件还展示了如何使用上述“类”来对测试集中的单词及其类型进行预测和预处理。
  • Kaggle Otto Group产品:kaggle_otto
    优质
    Kaggle Otto Group产品分类竞赛(kaggle_otto)是一项挑战数据科学家通过机器学习对未知产品的类别进行预测的比赛。参赛者需利用给定的产品特征,构建模型来优化解决方案的准确率。 在Kaggle Otto Group产品分类挑战赛的私人排行榜上,我取得了第66/3514名的成绩。解决方案使用了神经网络、XGBoost、随机森林和支持向量机四种算法,以及正则化贪婪森林和线性模型等方法。然而,在构建最终集成时只采用了前四种算法。有关更多信息,请参阅相关文档或联系我获取详情。
  • Kaggle:各 Kaggle汇总
    优质
    本项目汇集了来自Kaggle平台各比赛领域的优质代码和解决方案,旨在为参赛者提供学习资源与灵感。 Kaggle 上有各种比赛的相关代码。
  • Kaggle Leaf Classification: 植物幼苗
    优质
    简介:Kaggle Leaf Classification竞赛是一项专注于植物识别的机器学习挑战赛,参赛者通过分析和分类不同植物叶片图像来提高对各种作物品种的理解与区分能力。 KaggleLeaf分类竞赛是关于植物幼苗分类的。参赛者需要根据不同的特征来识别和分类植物幼苗。这是一个很好的机会,可以利用机器学习技术提高对植物学的认识,并与其他数据科学家竞争。
  • 数据集 - Kaggle: Classify-Leaves
    优质
    Classify-Leaves 是Kaggle平台上一个专注于植物叶片图像识别的比赛数据集,旨在促进机器学习社区对植物物种自动分类的研究与应用。 Kaggle网站上有一个深度学习竞赛资源,涉及树叶分类的竞赛数据集。
  • Python-Kaggle冠军Gluon实现
    优质
    本项目是关于如何使用Python库Gluon参加并赢得Kaggle狗分类比赛的技术分享,提供了模型训练、优化及部署的全过程。 使用Gluon实现的Kaggle狗分类比赛第一名的方法介绍了如何利用Gluon进行狗品种分类。
  • 猫与狗图像Kaggle数据集
    优质
    本数据集来自Kaggle上的猫与狗图像分类竞赛,包含大量高质量的猫和狗图片,用于训练机器学习模型识别宠物种类。 Kaggle上的竞赛数据用于区分猫和狗两类对象,数据格式为处理后的CSV文件。