
PyTorch CTPN:文本检测在OCR中的应用
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文介绍了基于PyTorch框架实现的CTPN(连接主义文本行检测)模型,并探讨了其在光学字符识别(OCR)技术中对文本检测的应用。
CTPN适用于水平文本检测,但对倾斜或弯曲的文本效果不佳。如果您对此类任务以及模型压缩感兴趣,请留意接下来要进行的两个项目。
在设置NMS(非极大值抑制)和bbox utils时,您需要先用Cython构建这些库:
1. 进入utils/bbox文件夹
2. 执行make.sh脚本:sh make.sh
这将在当前目录生成nms.so及bbox.so这两个动态链接库。
测试步骤如下:
- 按照说明设置并构建所需的库。
- 下载测试模型,并在inference.py中根据需要修改model_path、dir_path和save_path参数。
- 使用命令行运行python3 inference.py以测试模型。
基础模型及其尺寸信息:
| 基础模型 | 尺寸(MB) |
| :--: | :--: |
| vgg16_bn | 50.14 |
| shufflenet_v2_x1_0 | 25.39 |
| mobilenet (未列出具体尺寸) |
请注意,表中仅提供了部分模型的大小信息。
全部评论 (0)
还没有任何评论哟~


