本研究提出了一种基于改进YOLOv框架的短袖短裤自动识别系统,旨在提高服装分类精度和效率,为智能零售提供技术支持。
为了平衡检测分类的精度与模型运行的速度,在确保较高检测分类准确性的前提下,我们选择了基于YOLOv5的一阶段目标检测框架,并结合了模型压缩及加速技术进行优化。具体来说:
- **模型压缩**:通过BN放缩因子修剪主干网络来实现。
- **模型加速**:采用TensorRT封装部署以提高效率。
在训练过程中,使用Pytorch1.7.0作为深度学习框架,并应用随机几何变换、颜色扰动和翻转等数据增强技术。同时利用WiderPerson行人数据集(监控抓拍)及COCO行人数据集进行预训练模型的构建。此外,在优化超参数方面采用了以下设置:批量大小为8,SGD动量0.843,权重衰减系数为0.00036和初始学习率为0.0032;非极大值抑制(NMS)阈值设为0.5,正样本的阈值同样设定在了这个水平。
实验结果显示:对于街拍与商场场景中H:W比为2:1的图像而言,采用输入大小480的模型可以获得更好的检测效果;而对于H:W比例为1:2的情况,则使用640作为输入尺寸时表现更佳。因此,在实际测试阶段我们采取了双模型策略,根据输入图片的具体尺寸选择最合适的模型进行预测。
最后通过实验验证发现,相较于包含更多类别的分类器,8类目标的模型在性能上占据优势,并且结合TensorRT与Slimming技术的应用后显著提升了运行效率。