1、引入pdf2docx
注意管理员模式安装
代码语言:javascript复制pip install pdf2docx
2、主体代码
直接复制使用,将需要转化的文件和py放在同一个文件夹下,直接运行即可。
代码语言:javascript复制import os
from pdf2docx import Converter
def pdf_docx():
# 获取当前工作目录
file_path = os.getcwd()
# 获取所有文件
files = os.listdir(file_path)
# 遍历所有文件
for file in files:
# 过滤临时文件
if '~$' in file:
continue
# 过滤非pdf格式文件
if file.split('.')[-1] != 'pdf':
continue
# 获取文件名称
file_name = file.split('.')[0]
# pdf文件名称
pdf_name = os.getcwd() '\' file
# docx文件名称
docx_name = os.getcwd() '\' file_name '.docx'
# 加载pdf文档
cv = Converter(pdf_name)
# cv.convert(docx_name, start=0, end=12)
cv.convert(docx_name)
cv.close()
if __name__ == '__main__':
pdf_docx()