python 的第三方包glob识别特定格式的文件
在做kaggle的猫狗识别的比赛时,要对图片来分区是猫还是狗,glob包起了很大的作用。下面来用例子说明:
代码语言:javascript复制from glob import glob
import os
os.chdir("E:\Windows.old\Users\zhangxiang\Desktop\tensorflow_learning\tensorflowCatVsDog-master")
files_path = './train'
#构建匹配的模板
cat_files_path = os.path.join(files_path, 'cat*.jpg')
dog_files_path = os.path.join(files_path, 'dog*.jpg')
print (cat_files_path)
结果: ./traincat*.jpg 用于匹配猫的图片
下面来把所有猫的图片找出来,以及是狗的图片也找出来。
代码语言:javascript复制#glob,找出所有匹配的图片
cat_files = glob(cat_files_path)
dog_files = glob(dog_files_path)
print(dog_files[0:10])
结果: [‘./traindog.0.jpg’, ‘./traindog.1.jpg’, ‘./traindog.10.jpg’, ‘./traindog.100.jpg’, ‘./traindog.1000.jpg’, ‘./traindog.10000.jpg’, ‘./traindog.10001.jpg’, ‘./traindog.10002.jpg’, ‘./traindog.10003.jpg’, ‘./traindog.10004.jpg’]
这样就可以把猫和狗的图片找出来。
代码和数据:
代码语言:javascript复制https://github.com/zhangdm/Hello-World/tree/master/python_glob_识别特定类的图片