
Tesseract-OCR:Python中的中文图片识别引擎
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
Tesseract-OCR是一款开源的文字识别工具,此简介主要介绍如何在Python中使用它来进行中文图片文字的识别与提取。
Tesseract-OCR 是一个支持英文和中文识别的 Python 图片文字识别引擎,语言库丰富且可选择性安装需要的语言。解压后直接按照提示进行下一步操作即可完成安装。安装完成后,在 `pytesseract.py` 中设置 `tesseract_cmd = C:/Program Files (x86)/Tesseract-OCR/tesseract` 和 `tessdata_dir_config = --tessdata-dir C:\\Program Files (x86)\\Tesseract-OCR\\tessdata`,并将其赋值给函数 `def image_to_string(image, lang=None, boxes=False, config=tessdata_dir_config)`。这样就可以使用该引擎进行图片文字识别了。
全部评论 (0)
还没有任何评论哟~


