glob模块是用来获取文件路径的一个常用模块。它可以根据用户指定的路径来搜索文件,然后返回符合规则的文件路径列表。
一、glob库函数的基本用法
glob库需调用glob.glob()函数并传入特定的路径规则。路径规则可以包含通配符,例如使用*来匹配任意个字符,使用?来匹配单个字符。以下是一个示例:
代码语言:javascript复制import glob
# 获取当前目录下所有的文本文件
files = glob.glob("*.txt")
print(files)
二、使用通配符进行模糊匹配
glob库函数中通配符匹配使用比较频繁,可以通过通配符匹配获取符合规则的文件路径列表。
代码语言:javascript复制import glob
# 获取当前目录下所有以.txt结尾的文件
files = glob.glob("*.txt")
print(files)
# 获取当前目录下以f开头,以.txt结尾的文件
files = glob.glob("f*.txt")
print(files)
# 获取当前目录下以任意字母开头,以.ppt或.pptx结尾的文件
files = glob.glob("[a-zA-Z]*.ppt*")
print(files)
# 获取当前目录下以数字为文件名的txt文件
files = glob.glob("[0-9]*.txt")
print(files)
# 获取当前目录下任意一级子目录下的txt文件
files = glob.glob("*/*.txt")
print(files)
三、使用递归匹配子目录中的文件
除了对当前目录下进行文件搜索,glob库函数还可以在子目录中递归搜索文件。可以通过传入特定的路径规则实现递归匹配。
代码语言:javascript复制import glob
# 获取当前目录及其子目录下所有的txt文件
files = glob.glob("**/*.txt", recursive=True)
print(files)
# 获取当前目录及其子目录下所有的py文件
files = glob.glob("**/*.py", recursive=True)
print(files)
以上代码中的**表示匹配任意层级的子目录。
四、使用glob函数结合其他库的实际应用
1. 读取文件夹下的图片文件
代码语言:javascript复制import glob
from PIL import Image
# 读取当前目录下所有的jpg和png文件,并显示图片
image_files = glob.glob("*.jpg") glob.glob("*.png")
for file in image_files:
img = Image.open(file)
img.show()
2. 统计某文件夹中所有文本文件的行数
代码语言:javascript复制import glob
# 统计当前目录下所有的txt文件的行数总和
files = glob.glob("*.txt")
total_lines = 0
for file in files:
with open(file, "r") as f:
lines = f.readlines()
total_lines = len(lines)
print("Total lines:", total_lines)
3. 批量处理文件
代码语言:javascript复制import glob
import shutil
# 将所有的txt文件移动到一个新的文件夹
files = glob.glob("*.txt")
for file in files:
shutil.move(file, "new_folder")
收藏 | 0点赞 | 0打赏