
PdfToc:从PDF文件中提取目录(ToC)和书签
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
PdfToc是一款高效实用的工具,专门用于从PDF文档中快速准确地抽取目录(ToC)和书签信息。
从 PDF 文件中提取目录(ToC)的方法是基于 Apache PDFBox 的系统要求 Java 1.8.52,并且需要使用编译好的 PdfToc.jar 文件。
安装步骤如下:
- 复制./bin/PdfToc.jar
用法说明:
- 使用命令 `java -jar PdfToc.jar -i file.pdf` 来获取 ToC 并将其打印到标准输出。
- 如果想要将 ToC 输出保存为 toc.txt,可以使用命令 `java -jar PdfToc.jar -i file.pdf toc.txt`
输出格式:
- PageNumber:pdf 文件的页面。第一个页面编号是 1(而不是0)。
- level:标题级别。0 是根级别,1 是下一级等。
例如:
页码级标题
PageNumber - pdf文件中的页面位置;
level - 标题级别的标识;
其中,PageNumber 表示 PDF 文件的页面位置,第一个页面编号为 1(而不是从0开始)。而 level 则表示该标题在目录结构中的级别:根级别对应于数字 0,下一级则为 1 等。
全部评论 (0)
还没有任何评论哟~


