
基于Keras和TensorFlow的人工智能项目实践:OCR的定位与识别功能开发
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本书介绍如何使用Keras和TensorFlow框架进行人工智能项目的实践,重点讲解了光学字符识别(OCR)技术中的文字定位与识别功能开发。
使用Keras实现OCR定位与识别的后端为TensorFlow,在Windows 10系统下运行,并采用Titan X显卡进行训练。数据集包含超过300万个中英文数字样本,存在语料不均衡的问题。
实验采用了两种模型:
- CRNN:由VGG、双向LSTM和CTC组成。
- DenseNet-OCR:结合DenseNet与CTC的网格结构。
性能对比如下:
- CRNN:60ms处理时间,准确率97.2%。
- DenseNet+CTC:8ms处理时间,准确率98.2%,模型大小为18.9MB。
全部评论 (0)
还没有任何评论哟~


