1. 简介
OCRmyPDF 工具通过 OCR 技术扫描出 PDF 文件中的文字部分,可将不可复制的 PDF 文件(扫描版)转换为可复制的 PDF 文件(文字版)。除此之外,OCRmyPDF 还有诸如 PDF 渲染、优化等功能。最重要的是,OCRmyPDF 是开源免费的。
2. 安装
OCRmyPDF 工具在 Windows 和 Linux 上都可以安装使用,详细参见 OCRmyPDF 官方手册。
3. 使用
- 示例:将扫描版
inputfile.pdf
转为可复制的文字版outputfile.pdf
ocrmypdf inputfile.pdf outputfile.pdf