
PyTorchOCR:包含Psenet、Pan、Dbnet、Sast和Crnn的PyTorch OCR算法库
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
PyTorchOCR是一款集成了多种先进光学字符识别(OCR)模型(如PSenet、Pan、Dbnet、Sast及Crnn)的开源算法库,为文本检测与识别提供高效解决方案。
该项目提供基于PyTorch的OCR库代码详解及个人经验心得分享,并会持续更新相关内容以帮助新接触该领域的学习者。
最近更新记录如下:
- 2021年5月1日:修复了多GPU训练问题,改用LMDB格式进行数据训练。需要先将图片转换为LMDB格式(相关代码位于script文件夹内),并进行了若干优化和模型结构调整,在训练时使用带lmdb名称的yaml配置文件。
- 2021年3月26日:更新了CRNN训练效果,并整理上传了相应的源码。
- 2021年3月6日:添加了CRNN backbone resnet 和 mobilev3 的实现及对应配置文件。
- 2020年12月22日:增加了关于 CRNN+CTCLoss+CenterLoss 训练的相关内容。
- 2020年9月18日:发布了文本检测的说明文档。
- 2020年9月12日:更新了DB、PSE、PAN、SAST和CRNN等训练及测试代码,并提供了预训练模型。
全部评论 (0)
还没有任何评论哟~


