Python检查Word文件中包含特定关键字的所有页码

2020-08-07 16:30:44 浏览数 (1)

任务描述:

检查Word文件中包含特定关键字的所有页码。

基本思路:

Word文件属于流式文件,在没有打开之前难以确定页码,可以考虑临时转换为PDF文件,这样就可以确定页码了,再逐页提取PDF文件中的文字,如果包含特定关键字就输出相应的页码。

参考代码:

0 人点赞