(macOS)使用 pdfcpu 清除 PDF 注释与高亮
在日常办公、资料整理或文档归档过程中,PDF 文件中的高亮、批注和便签等注释内容,往往影响阅读体验,甚至可能泄露敏感信息。本教程将介绍如何使用开源命令行工具 pdfcpu 批量移除 PDF 中的各种注释,让您的文档"干净"如新。
注:本教程仅适用于 macOS 用户。
PDF 注释及其影响
PDF 注释(Annotations)包括:
- 高亮(/Highlight)
- 下划线(/Underline)
- 便签/文本框(/Text)
- 其他批注(如 /StrikeOut、/Squiggly 等)
在分享或归档前清除这些注释,不仅让文档更专业,也可防止无意中泄露批注信息。
准备工作:安装 pdfcpu
pdfcpu 是一款轻量的 PDF 处理工具,本教程仅针对 macOS 用户。推荐通过 Homebrew 安装:
brew install pdfcpu
若尚未安装 Homebrew,请先访问 Homebrew 官网 安装。
使用 pdfcpu 一次性移除注释
执行以下命令,可删除 PDF 文件中所有类型的注释:
pdfcpu annotations remove -mode all input.pdf output.pdf
-mode all
:同时移除高亮、下划线、文本框、便签等所有注释。
执行完成后,生成的 output.pdf
即不含任何注释。
如果省略 output.pdf
,则会在原文件上直接覆盖。
pdfcpu annotations remove -mode all input.pdf
常见提示
若 PDF 中无任何注释,终端会显示:
pdfcpu: RemoveAnnotations: No annotation removed
此时不会生成或修改文件。
批量处理多个 PDF
结合 Shell 脚本,可批量清除当前目录下所有 PDF 的注释:
for file in *.pdf; do
pdfcpu annotations remove -mode all "$file" "cleaned_$file"
done
上述脚本会针对每个文件生成一个以 cleaned_
为前缀的新文件。
注意事项
- 文件备份:如果不指定输出文件,原文件将被覆盖,操作前请做好备份。
- 加密PDF:部分受密码保护或加密的 PDF 需先解密后方可处理。
- 正文完好:本命令只移除注释,不会修改正文文本。
- 隐藏信息:如需进一步清除元数据、隐藏信息,可参考 结合 ExifTool 工具清除元信息。
相关
如果需要更细致的编辑和处理PDF,可以考虑使用专业的PDF编辑工具
pdfcpu 的更多使用技巧,请查阅 pdfcpu 项目主页 及官方文档。