【深度学习实验】图像处理（一）：Python Imaging Library（PIL）库：图像读取、写入、复制、粘贴、几何变换、图像增强、图像滤波

一、实验介绍

图像处理在深度学习领域中起到了至关重要的作用，Python Imaging Library（PIL）作为一种主流的图像处理库，为图像的读取、处理和增强提供了丰富的功能。

本实验将介绍 PIL 的基本用法，主要包括图像读取、写入、复制、粘贴、几何变换以及图像增强、图像滤波等方面。

Pillow v2.4.0 (PIL fork)

二、实验环境

本系列实验使用了PyTorch深度学习框架，相关操作如下：

1. 配置虚拟环境

代码语言：javascript复制

conda create -n DL python=3.7

代码语言：javascript复制

conda activate DL

代码语言：javascript复制

pip install torch==1.8.1 cu102 torchvision==0.9.1 cu102 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html

代码语言：javascript复制

conda install matplotlib

代码语言：javascript复制

 conda install scikit-learn

2. 库版本介绍

软件包	本实验版本	目前最新版
matplotlib	3.5.3	3.8.0
numpy	1.21.6	1.26.0
python	3.7.16
scikit-learn	0.22.1	1.3.0
torch	1.8.1 cu102	2.0.1
torchaudio	0.8.1	2.0.2
torchvision	0.9.1 cu102	0.15.2

三、实验内容

0. 安装 PIL 库

可以使用以下命令：

代码语言：javascript复制

pip install pillow

1. 图像读取和写入

下面，我将介绍如何使用 PIL 的 Image.open 方法读取图像，并使用 display 方法显示图像。展示了如何使用 save 方法将图像保存到设备上、使用 Image.new 构建新的图像。

a. 图像读取

代码语言：javascript复制

from PIL import Image

# we can use open api to load image data 
img = Image.open('qomolangma.jpg')
print(img.format,img.size)
# show your image
display(img)

b. 图像写入

代码语言：javascript复制

import os

# we can utilize save() to write current image to device.
file_name = 'qomolangmah.jpg'
img.save(file_name)
print(os.path.join(os.getcwd(),file_name))

c. 构建新图像

代码语言：javascript复制

image_new = Image.new('RGB', (50, 50), 'red')
display(image_new)
file_name = 'new.png'
image_new.save(file_name)
print(os.path.join(os.getcwd(), file_name))

2. 图像复制粘贴

PIL 提供了灵活的图像复制和粘贴功能，下面我将介绍全局级别和局部级别的图像复制，以及使用 crop 方法进行局部图像复制。此外，还有图像的粘贴和合并操作。

a. 图像复制

代码语言：javascript复制

img = Image.open('qomolangma.jpg')
img_copy = img.copy()
display(img_copy)

b. 图像局部复制

代码语言：javascript复制

rect = (0, 0, 100, 100)
img_copy_local = img.crop(rect)
display(img_copy_local)

c. 图像粘贴

代码语言：javascript复制

img_new = Image.open('new.png')
box = (10, 10, 60, 60)
img.paste(img_new, box)
display(img)

3. 几何变换

图像的几何变换是图像处理中的重要任务之一，下面我将详细介绍图像的调整大小、旋转和翻转操作。

a. 图像调整大小

代码语言：javascript复制

img = Image.open('qomolangma.jpg')
print(img.size)
img_resize = img.resize((512, 224))
print(img_resize.size)

b. 图像旋转

代码语言：javascript复制

img_rotate = img.rotate(45)
display(img_rotate)

或使用：

代码语言：javascript复制

img_rotate = img.transpose(Image.ROTATE_90)
img_rotate = img.transpose(Image.ROTATE_180)
img_rotate = img.transpose(Image.ROTATE_270)
display(img_rotate)

c. 图像翻转

代码语言：javascript复制

img_flip = img.transpose(Image.FLIP_LEFT_RIGHT)
display(img_flip)

4. 图像增强

PIL 提供了 ImageEnhance 和 ImageFilter等模块，用于图像的亮度、颜色、对比度和锐度的增强。下面，我将通过示例演示如何使用这些模块进行图像增强。

a. 图像亮度增强

代码语言：javascript复制

from PIL import ImageEnhance

img = Image.open('qomolangma.jpg')
img_bri = ImageEnhance.Brightness(img)
img_bri_enh = img_bri.enhance(factor=0.5) # factor is from 0 to 1. 
display(img_bri_enh)

b. 图像颜色增强

代码语言：javascript复制

img_col = ImageEnhance.Color(img)
img_col_enh = img_col.enhance(factor=1.5)  # factor is from 0 to postive infinity
display(img_col_enh)

c. 图像对比度增强

代码语言：javascript复制

img_con = ImageEnhance.Contrast(img)
img_con_enh = img_con.enhance(factor=1.5)  # factor is from 0 to postive infinity
display(img_con_enh)

d. 图像锐度增强

代码语言：javascript复制

img_sha = ImageEnhance.Sharpness(img)
img_sha_enh = img_sha.enhance(factor=1.5)  # factor is from 0 to 2
display(img_sha_enh)

5. 图像滤波

PIL 的 ImageFilter 模块提供了多种滤波操作，如浮雕（EMBOSS）和轮廓（CONTOUR）等。

a. 图像滤波 - 浮雕

代码语言：javascript复制

from PIL.ImageFilter import EMBOSS, CONTOUR

img_1 = img.filter(EMBOSS)
display(img_1)

b. 图像滤波 - 轮廓

代码语言：javascript复制

img_2 = img.filter(CONTOUR)
display(img_2)

python 深度学习图像处理 display image

0 人点赞