
IIIT文本识别数据集.zip
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本资源包包含了一个用于训练和测试文本识别算法的数据集,由印度信息技术学院整理发布。内含丰富多样的文字图像样本,适用于光学字符识别(OCR)等领域研究。
文本识别数据集包括IIIT训练集的2000张图片和测试集的3000张图片,标签对应每张图片上的单词。train.txt和test.txt文件是经过过滤后的标签(去除了符号及少于三个字符的内容)。此外还有两个原始版本的未经过滤的标签文件,可以自行添加相应的文件路径或在我的主页下载带有路径信息的代码文件(python格式)进行使用。
全部评论 (0)
还没有任何评论哟~


