
使用TensorFlow和Keras/PyTorch进行自然场景文字检测及端到端中文OCR识别项目的源码、模型与数据集
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目采用TensorFlow/Keras和PyTorch框架,致力于开发自然场景中的文字检测及端到端的中文OCR识别技术。包含完整源码、预训练模型以及相关数据集。
使用tf实现自然场景中的文字检测,并通过keras或pytorch实现CTPN+CRNN+CTC来完成不定长的场景文字OCR识别。此方法可以进行0、90、180、270度的文字方向检测。
该方案分为三个网络:
1. 文本方向检测网络:使用预训练的VGG16模型。
2. 文本区域检测网络:采用CTPN(CNN+RNN)架构。
3. EndToEnd文本识别网络:使用CRNN(CNN+GRU/LSTM+CTC)。
运行测试时,只需在demo.py中写入测试图片路径。若想查看ctpn的检测结果,则需要修改./ctpn/ctpn/other.py 文件中的draw_boxes函数,在该函数的最后一部分添加cv2.imwrite(dest_path,img),这样可以获取到文字区域框及图像OCR识别的结果。
全部评论 (0)
还没有任何评论哟~


