
YOLO-World全套代码资源
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
YOLO-World全套代码资源提供包括目标检测、图像识别在内的YOLO系列算法的完整开源代码与教程,助力开发者快速上手和深入研究。
You Only Look Once(YOLO)系列探测器已经成为高效实用的工具。然而,它们对预定义训练对象类别的依赖限制了其在开放场景中的应用范围。为了解决这一局限性,我们提出了 YOLO-World,这是一种通过视觉语言建模和大规模数据集上的预训练来增强 YOLO 开放词汇检测能力的方法。具体来说,我们提出了一种新的可重新参数化的视觉-语言路径聚合网络(RepVL-PAN)以及区域-文本对比损失函数,以促进视觉与语言信息之间的交互作用。我们的方法能够高效地在零射程条件下识别多种物体,并且表现出色。
在具有挑战性的LVIS数据集上,YOLO-World 在 NVIDIA V100 上实现了每秒52.0帧的速度和35.4 AP 的准确率,在速度与准确性方面均超越了许多最先进的方法。此外,经过微调的 YOLO-World 还在多个下游任务中取得了优秀的表现,包括物体检测以及开放词汇实例分割。
全部评论 (0)
还没有任何评论哟~


