
PDF表格提取器:从PDF文档中抽取表格
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
PDF表格提取器是一款高效工具,专门用于从复杂的PDF文件中快速准确地抽取表格数据。简化数据分析与处理流程,提升工作效率。
PDF表格提取器可以将表转换为CSV格式,并将页面保存为PNG图片。它使用一种简单的启发式方法来过滤顶部的相关表格。
输出示例包括:
- doc1.document.json
- doc1.page.005.json
- doc1.page.005.png
- doc1.page.005.table.00.csv
- doc1.page.005.table.00.json
- doc2.document.json
- doc3.document.json
- doc3.page.004.json
- doc3.page.004.png
- doc3.page.004.table.00.csv
- doc3.page.004.table.00.json
此外,还有日志文件:log-20180527-170650.log。
该程序需要Java 8环境。运行时命令为:
>java -jar tables-extractor-2.0.0-jar-with-dependencies.jar
全部评论 (0)
还没有任何评论哟~


