
SVHN-Detection-and-Classification-using-Street-View-House-Numbers
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目利用街景房屋号码(SVHN)数据集进行物体检测与分类研究,旨在提升对自然环境中的数字识别精度和效率。
我尝试使用两个卷积神经网络(CNN)对街景门牌号码数据集中的数字进行检测与分类,但效果并不理想。该项目包含两部分:首先利用一个CNN执行边界框回归以确定图像中所有数字的顶部、左侧、宽度和高度;然后基于步骤一得到的边界框提取仅含有数字的部分,并通过另一个多输出CNN对剪切后的图片进行数字识别。
我的初衷是,相较于直接将整个SVHN图像输入到神经网络并让其预测其中的所有数字,这种方法能够提高准确性。然而,在实际操作中,整体流程只能达到51%的整体准确率(即所有数字完全匹配)。同时第一、第二、第三和第四位的单个数字识别精度分别为71%,65%,84% 和98% (只考虑最多四位数的情况)。
检测与分类过程如下:
- 获取输入图像,目前仅在SVHN测试集上进行了尝试。
- 调整为64x64像素大小,并转换成灰度图进行标准化处理;
- 将经过预处理的图像送入用于检测边界框的第一步CNN中获取边界信息。
全部评论 (0)
还没有任何评论哟~


