
OCR表格识别-Pip安装包-表格外提取-版面还原
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目专注于OCR技术在表格处理中的应用,包括通过Pip安装相关软件包、从图像中精确提取表格数据及进行版面还原等关键技术。
OCR表格识别涉及使用pip安装包来提取文档图像中的表格结构,并将其还原为HTML格式。这项工作主要基于PaddleOCR的模型进行,目前支持两种类型的表格识别:中文和英文。
具体来说,可以分析给定的表格图片并重建其对应的HTML格式。以下是可用模型及其大小:
- 英文表格识别模型名称:en_ppstructure_mobile_v2_SLANet.onnx
- 模型大小:7.3M
- 中文表格识别模型名称:ch_ppstructure_mobile_v2_SLANet.onnx
- 模型大小:7.4M
由于英文表格识别模型(en_ppstructure_mobile_v2_SLANet.onnx)体积较小,已经预先打包进whl包内。如果需要进行英文表格的识别工作,可以通过pip命令直接安装使用:
```
$ pip install rapid-table.whl
```
全部评论 (0)
还没有任何评论哟~


