
在 Keras-TensorFlow 中实现的场景文本检测 YOLO 算法
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目实现了基于Keras和TensorFlow框架下的YOLO算法,专注于场景文本检测任务。通过优化模型结构与参数,提高了对复杂背景中文字的识别精度及速度。
在 keras-tensorflow 中实现了用于场景文本检测的 YOLO 算法(不使用对象检测 API),可以调整代码以适应不同的对象检测任务。构建高效 OCR 系统的第一步是利用该算法找出特定的文本位置。通过从头开始实现 YOLO (You Only Look Once) 算法,我们可以针对 python 中的场景文本检测进行优化。
数据集使用的是 ICDAR 提供的数据集:
- 训练图像:376 张
- 验证图像:115 张
预处理步骤由 Preprocess.py 文件执行。首先将所有图片调整为 (512, 512) 尺寸,并相应地修改边界框的真实坐标。接着,对这些图像进行归一化处理,将其范围设置在 [-1 , 1] 内。同时,地面实况坐标的预处理被转换成一个维度矩阵(网格高度、网格宽度、1、5)的形式。
对于自定义数据的使用,在 Preprocess.py 文件中需要做必要的修改以适应新的输入格式和需求。
全部评论 (0)
还没有任何评论哟~


