Advertisement

华录2020数据湖算法大赛—定向算法赛(吸烟打电话检测)第二名...

  • 5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
在2020年中国华录杯·数据湖算法大赛中,火录杯·定向算法赛(吸烟打电话检测)的第二名由开源作者fire15完成,联系邮箱为队伍名称。参赛者取得了优异的成绩,在初赛A榜上表现出色,获得99.84的分数,并最终位列第二名(同时获得两周周冠军)。在初赛B榜上,成绩为84.09分,排名第七。复赛A榜上的表现同样亮眼,获得了99.15的分数并位列第五名;复赛B榜上的成绩为93.13分,最终获得第二名。在决赛答辩环节中,该项目也获得了高度认可。比赛的具体地址如下:首先对算法进行了详细的介绍。数据处理过程中,由于手机拍摄的高清图片分辨率较高且体积较大,导致IO操作耗时较长。为了加快训练速度,首先对图片进行等比缩放并保存为预处理步骤;随后合并初赛阶段的数据进行清洗和去重操作;最后,通过定制化的CutMix技术进行数据增强预处理,先生成一部分预处理后的图片。主要的训练方式是基于EfficientNet-B4的基础模型,并结合了对抗学习的预训练模型以及Ranger优化器和SGDR学习率衰减策略。通过持续监测验证集的mAP分数来选择最优的模型参数配置,并采用early stop机制来控制训练过程。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • 2020年中国杯·——分享:hualubeiCallCheckSmoking...
    优质
    在2020年中国华录杯·数据湖算法大赛中,作者团队荣获定向算法赛(针对吸烟和打电话行为检测项目)的第二名。他们的解决方案展示在hualubeiCallCheckSmoking项目中,通过创新的数据处理和技术手段,在众多参赛队伍中脱颖而出。 2020年中国华录杯·数据湖算法大赛—定向算法赛(吸烟打电话检测)第二名开源作者:fire15 队伍名称:一个人要像一支队伍 成绩:初赛A榜:99.84 / 第二名 (两周周冠军),复赛A榜:99.15 / 第五名,复赛B榜:93.13 / 第二名,决赛答辩:第二名 算法简介: 数据处理时发现许多手机拍摄的高清图片分辨率较大。由于我的机器性能有限,IO操作较慢,为了加速训练过程,在开始阶段预先等比例缩放并保存好这些图像;然后合并初赛的数据,并进行清洗和去重工作;最后通过定制化的CutMix方法对数据集进行预增强处理。 主要采用EfficientNet-B4作为基础模型。在训练过程中使用了对抗学习的预训练模型,Ranger优化器以及SGDR的学习率衰减策略。根据验证集中mAP分数监测结果选择最佳模型,并应用early stop停止过早或过度的训练过程。
  • 目标
    优质
    本数据集专注于电话使用场景下的吸烟行为识别,通过收集和标注大量图像与视频数据,为开发高效的目标检测算法提供支持。 我们提供一个包含1559张图片的YOLO格式标注数据集,可以直接用于训练YOLO系列模型。 标注示例: 1 0.7974683544303798 0.5 0.16455696202531644 0.2777777777777778 说明:第一个数字“1”代表类别,后面的四个数值表示边界框的坐标(x1, y1, x2, y2)。
  • 优质
    本项目致力于研发能够同时进行电话使用习惯分析及监测个体吸烟行为的智能系统,旨在促进健康生活方式。 打电话检测和抽烟检测算法演示工具的Android版本仅支持红外夜视照片,其他类型的照片需要调整算法参数。
  • 届无线成果集.zip
    优质
    该资料集汇编了华为第二届无线算法大赛中的优秀研究成果,涵盖多种创新性算法和解决方案,旨在推动无线通信技术的进步与应用。 第二届华为杯无线算法大赛资料已打包为.zip文件。
  • 阿里云天池 & 美年健康AI — 双高疾病风险预方案:初43,复11.zip
    优质
    本项目展示了在阿里云天池算法大赛与美年健康联合举办的AI竞赛中,针对双高疾病的预测模型的开发成果。该项目团队从众多参赛队伍中脱颖而出,在初赛阶段获得了第43名的好成绩,并于复赛阶段成功提升至第11名,充分体现了其技术实力和创新思维在医疗数据分析及疾病预防领域的应用价值。 在医疗健康领域,人工智能技术的应用已成为推动行业进步的关键因素之一。特别是在大规模健康数据处理和分析方面,AI的潜力巨大。阿里云天池算法大赛与美年健康的合作赛事就是专注于提高高血压、高血糖疾病风险预测准确性的竞赛平台。该比赛吸引了众多数据科学家和技术专家参与,他们通过构建高效精准的模型来帮助医疗机构更早地识别出具有双高疾病风险的人群,并采取早期干预措施。 参赛者在初赛和复赛中提交的作品展示了他们在数据分析、机器学习、深度学习等多个领域的深厚功底和创新思路。解决方案的设计通常包括数据预处理、特征工程、模型选择、调参优化及结果评估等环节,要求参赛者具备扎实的理论基础以及解决实际问题的能力,并充分了解医疗健康行业知识。 “初赛43,复赛11”可能指的是在比赛过程中有43个团队进入初赛阶段,在复赛阶段则只有11个团队胜出。这反映了激烈的竞争态势和高水平的技术表现。“美年健康AI大赛”的标签表明了该赛事的赞助商及合作方是美年健康,并且该公司非常重视利用先进技术来改善医疗服务质量和效率。 文件名称列表中的“毕业设计”暗示这些文件可能与高等教育机构学生的学术项目相关,参赛者的作品不仅是为了解决实际问题的一部分,也可能成为他们学业生涯的重要组成部分。通过参与此类竞赛,学生能够将理论知识应用于实践检验自己的学习成果,并为其职业生涯积累宝贵经验。 这类AI大赛不仅推动了医疗行业在疾病风险预测方面的技术创新,还为数据科学领域的人才提供了一个展示自己能力的舞台,促进了行业内技术交流与分享,对于提升整个社会健康水平具有重要意义。
  • 危险驾驶行为:运用SSD目标识别闭眼、开口及等行为
    优质
    本项目采用SSD目标检测算法,旨在实时监测驾驶员是否存在闭眼、张口以及吸烟、接电话等潜在危险行为,以提高行车安全。 运行环境:1. Python 3.7.4 2. Pytorch 1.4.0 3. python-opencv 预训练的权重文件为 vgg_16,具体的配置请参考 Config.py 文件。 训练代码执行方式: - 训练时使用命令 `python Train.py` - 单张图片测试使用命令 `python Test.py` 目前进度如下: 1. PERCLOS计算完成 2. 眨眼频率计算完成 3. 打哈欠检测及计算完成 4. 疲劳检测完成 5. 人脸情绪检测完成 6. 口罩检测完成 网络性能指标:准确率82.18% 主要文件说明: - ssd_net_vgg.py: 定义 class SSD 的代码。 - Train.py: 训练代码。 - voc0712.py: 数据集处理代码(注意,此文件名未更改)。 - loss_function.py: 损失函数定义的脚本。 - detection.py: 处理检测结果的代码,将SSD返回的结果转换为opencv可以使用的格式。
  • 2020字中国创新:智慧海洋建设复训练集-
    优质
    本数据集专为2020数字中国创新大赛算法赛设计,旨在推动智慧海洋建设。该数据集包含丰富的训练集信息,助力参赛者优化模型、提升算法效能,共同探索海洋科技的无限可能。 2020数字中国创新大赛—算法赛:智慧海洋建设复赛训练集数据由于平台不支持zip文件上传,所以后缀改为.csv,请在解压时将文件名改回.zip格式。
  • 2020-2021年届全国学生设计与编程挑战(冬季)正式题目
    优质
    本简介涵盖2020至2021年间举办的第二届全国大学生算法设计与编程挑战赛冬季赛的正式竞赛题目,旨在展示参赛者在复杂算法和编程技巧方面的卓越才能。 2020-2021年度第二届全国大学生算法设计与编程挑战赛(冬季赛)正式赛题目。
  • 2020字中国创新-字政府道-智能:智慧海洋建设道源码.zip
    优质
    该文件为参加2020年数字中国创新大赛中数字政府赛道下的智慧海洋建设算法竞赛所使用的代码资源。包含用于海洋数据分析和智能化管理的多种算法实现,旨在推动智慧海洋领域的技术创新与应用。 2020数字中国创新大赛-数字政府赛道-智能算法赛:智慧海洋建设算法赛道代码.zip
  • .zip
    优质
    《算法竞赛数据》包含了一系列精心设计的数据集,旨在帮助编程与算法爱好者提升解题技巧和优化代码效率。适用于各类算法比赛的练习和准备。 在算法比赛中,数据是至关重要的元素,特别是在大数据领域。压缩包“算法比赛数据数据数据.zip”可能包含了用于训练和评估算法的各种数据集。接下来我们将详细探讨这些数据文件以及它们在大数据分析和算法竞赛中的应用。 我们看到一个名为“比赛-件量-train.csv”的文件。这很可能是训练数据集,用于构建和训练机器学习模型。CSV(Comma Separated Values)是一种常见的数据存储格式,便于数据分析。“件量”可能指的是某种业务或活动的数量,如电商订单数量、物流包裹等。该训练数据集通常包含已知结果(目标变量),以便模型可以学习识别模式并进行预测。 第二个文件是“aoi信息.csv”。AOI(Area of Interest)在地理信息系统中指特定的地理区域或感兴趣区域。“aoi信息.csv”可能包含与特定地理位置相关的详细信息,例如经纬度、人口密度和商业活动等。这些数据对于空间分析、市场划分或资源分配至关重要。 文件“小哥列表.csv”可能包含了参与服务执行人员的信息,比如快递员或配送员。这些数据包括姓名、ID、服务范围和服务效率指标等。这些信息有助于优化配送路线、提高服务质量或者预测配送时间。 在大数据背景下,处理这些数据集时可能会涉及以下知识点: 1. 数据预处理:清洗缺失值和异常值,转换数据格式,并归一化或标准化数值以适应机器学习算法。 2. 特征工程:从原始数据中创建新的特征。例如计算地理位置的距离或者基于件量的季节性趋势建立新特征。 3. 选择合适的模型:根据问题类型(分类、回归等)选择适当的机器学习模型,如线性回归、决策树或神经网络。 4. 模型训练与调优:使用交叉验证调整参数以提高性能,并通过测试数据集评估预测能力。常见评价指标包括准确率和F1分数。 5. 空间分析:若涉及地理信息,则可能需要GIS工具进行缓冲区分析、热点分析等空间统计方法的应用。 6. 集成学习:结合多个模型的预测结果,如使用投票法或平均法以提高整体性能。 7. 实时处理与流式计算:在大数据环境中实时更新并处理不断产生的数据流。 8. 并行计算和分布式系统:利用Hadoop、Spark等工具进行大规模数据分析。 这些压缩包中的文件是进行大数据分析和算法比赛的基础。通过深入理解和有效使用这些数据,参赛者可以构建出高效且准确的预测模型,在比赛中获得优势。