如何利用Python批量重命名PDF文件

2023-03-03 20:13:33 浏览数 (2)

除了普通的文件名修改,我们还可以将PDF内容提取出来并用于重命名

安装Python和使用PyChram编译器

Python的安装在这里并不想多少,目前网络上的教程都是正确的。 自从用了PyChram的编译器,世界更加美好了。编译环境可以根据每个项目不一样而不同。 下载地址:https://www.jetbrains.com/pycharm/

安装Jupyter Notebook

如果不安装Jupyter Notebook就无法在测试的时候显示出我们想要的效果,可能跟依赖包有关系。 在Terminal安装:

代码语言:javascript复制
pip3 install jupyter

安装tabula

在Terminal安装:

代码语言:javascript复制
pip install tabula-py

代码测试

运行以下代码测试:

代码语言:javascript复制
import tabula

demo = tabula.read_pdf('C:\Users\UserName\Downloads\1.pdf')
df2 = tabula.read_pdf("https://github.com/tabulapdf/tabula-java/raw/master/src/test/resources/technology/tabula/arabic.pdf")
print(demo)

这个时候其实已经出来了,不过你也可以用Jupyter Notebook来进行测试: 在Terminal输入

代码语言:javascript复制
jupyter notebook

这个时候会自动在浏览器打开Jupyter

由于我自己要测试用的文档无法使用,故而废弃。

参考文献

1. CSDN 2. 知乎 3. Towards Data Science

0 人点赞