Python+pymupdf处理PDF文档案例6则

2020-07-21 16:11:42 浏览数 (1)

任务描述:

  1. 提取PDF文件中的文本,保存为文本文件
  2. 合并PDF文档
  3. 把PDF文档按页转换、拆分成独立图片,每页一个图片文件
  4. 合并多个图片为PDF文件,每个图片占一页
  5. 提取PDF中的所有图片,保存为独立的图片文件
  6. 在PDF文件指定位置添加文本注释
  7. 为PDF文件中的关键字添加高亮、下画线、删除线

测试文件内容:

安装扩展库:

参考代码:

提取的文本:

合并的PDF文件

拆分的图片和提取出来的图片文件:

合并的图片式PDF文件内容:

加注释以后的效果:

0 人点赞