本项目使用MATLAB开发,专注于车辆检测领域的实时图像处理。通过高效的算法实现对视频流中车辆目标的快速识别与跟踪,适用于智能交通系统和自动驾驶场景。
此文档提供了官方的Faster R-CNN代码(用MATLAB编写)。如果您希望在NIPS 2015论文中复制结果,请使用该代码。
本存储库还包括对MATLAB代码进行Python重新实现的内容,这些内容基于特定分支构建,并且与原始版本略有不同。特别是,此Python端口的测试速度比原版慢大约10%,因为某些操作在CPU上的Python层执行(例如,处理一张图像时需要220毫秒,而用VGG16则为200毫秒)。
尽管如此,该实现仍然提供了与MATLAB版本相似但不完全相同的mAP,并且由于细微的实现差异,它无法与使用MATLAB代码训练得到的模型兼容。此外,此Python端口包括近似的联合训练方法,比交替优化(适用于VGG16的情况)快约1.5倍。
该工作最初在某个会议中描述并随后发布于NIPS 2015会议上。
这篇论文由任少卿、何开明、罗斯·吉尔希克和孙健(微软研究院)撰写。Python实现包含了Cornell大学的Sean Bell在其MSR实习期间编写的代码内容。
更多信息可以直接联系官方团队获取。