PIL：图像处理模块，功能强大、简单易用

楔子

PIL 是一个专门用来处理图像的模块，可以对图象进行各种各样的变换，下面我们就来看看这个模块用法。

首先需要安装，直接 pip install pillow 即可。

打开一张图片

首先是打开图片，可以使用 PIL 中的 Image.open 函数：

from PIL import Image

# 调用Image下的open方法，即可打开一张图片
# 得到的im便是图片的字节流，我们可以对im进行操作
im = Image.open("古明地觉.jpg")

1. 显示图片

im.show()

2. 获取图片信息

print(im.format)  # JPEG

3. 获取大小

print(im.size)  # (960, 626)

关于图片的大小，我要说两句。首先图片的结构是一个三维数组，第一维表示行，第二维表示列，第三位表示rgb或者灰度值；我们平常说一张图片是1920 * 1080，指的是这张图片每一行有1920个像素，每一列有1080个像素，想成一个矩形的话，就是长为1920，宽为1080；每一个像素点，是一个rgb或者灰度值，所有的像素组合，成为一张图片。

1920 * 1080相当于是有1080行，1920列，一般我们对数组进行操作时，比如numpy，通过指定在哪一行、以及哪一列来获取对应的元素。都是先确定行，然后再确定列；比如对于一张1920 * 1080的图片，假设转为了一个 numpy 里面的数组。我如果要获取图片最右下角的那一个点的像素值的话，我要怎么获取呢？是 arr[1080, 1920]，还是arr[1920, 1080] 呢？答案显然是前者，因为数组会先确定行，然后再确定列。1920 * 1080表示有1080行，1920列，所以是 arr[1080, 1920]，如果是 arr[1920, 1080] 的话，显然长度越界了。

这里的图片 size 是 (960, 626) ，表示图片的长是960个像素，宽626个像素。对应数组则是：626行，960列。

4. 获取图片对应的直方图

print(im.histogram())
"""
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 1, 2, 4, 5, 5, 5, 5, 5, 9, 15, 27, 25, 24, 
30, 30, 47, 67, 78, 96, 130, 133, 164, 182, 178, 205, 260, 281, 275, 250, 252, 238, 268, 258, 259, 265, 294, 
...
...
...
"""

im(图片字节流)的一些操作

1. 获取某一个像素

# 之前我们说先按照行，再按照列获取像素点。
# 但是在im.getpixel里面是按照列和行来的，因为这样符合我们的日常思维，但是有的就不是
# 所以有时候是按照行和列，还是列和行，容易混淆，就很烦
# 这里则是获取长度为第850、宽度为第300个像素，以元组的形式传入。我们这里是彩色图片，所以会返回一个三元组
print(im.getpixel((850, 300)))  # (246, 214, 215)
# 此外获取还有一种办法
pixel = im.load()
print(pixel[850, 300])  # (246, 214, 215)
# 并且下面的方法会更快一些

2. 修改某个像素的颜色

# 这里第一个参数是像素的位置，依旧是列和行的顺序
# 第二个参数是rgb三元组
for i in range(im.size[1]):
    im.putpixel((i, i), (100, 100, 100))

im.show()
# 或者
"""
pixel = im.load()
for i in range(im.size[1]):
    pixel[i, i] = (100, 100, 100)
im.show()
"""
# 下面这种方式会更快一些

注意到图片上有一个斜线，就是我们对像素进行修改的结果。因此修改像素是在本地进行操作的，直接影响im，进而影响im.show()所显示的图片。另外值得一提的是，我这里的代码省略了一部分，不是一次性执行的，而是反复执行。为了简洁，我把加载图片这一步省略了。

3. 图像缩放

# 缩放为原来的1/2
im1 = im.resize((im.size[0] // 2, im.size[1] // 2))
im1.show()

此外还有一种缩放图片的方式，im.thumbnail，这个和resize不同，resize是返回一个新的对象，thumbnail则是在原来对象的基础上进行修改，所以可以先copy一下。

from PIL import Image

im = Image.open("古明地觉.jpg")

im1 = im.copy()
# 缩放为原来的1/2
im1.thumbnail((im.size[0] // 2, im.size[1] // 2))
im1.show()

4. 图像翻转

# 填入角度，按照逆时针进行翻转
im1 = im.rotate(90)
im1.show()

5. 图像的裁剪与粘贴

# 先获取一个矩形区域，传入矩形的左上顶点和右下顶点两个坐标
# 这样就能定位一个矩形
box = (120, 194, 220, 294)

# 裁剪，然后旋转九十度，得到的仍是一个Image对象
region = im.crop(box).rotate(90)

# 粘贴，传入两个参数，Image对象，位置
im.paste(region, box)

# 这个不会返回新的对象，直接在本地修改
im.show()

6. 图像通道的分离

彩色图像有三个通道，可以对通道进行分离，得到三个通道分别对应的图像，此时每个图像只有一个分量。注意：分离的之后，得到的仍是Image对象。

from PIL import Image

im = Image.open("古明地觉.jpg")

r, g, b = im.split()
print(r)  # <PIL.Image.Image image mode=L size=960x626 at 0x1EB4768B048>
print(g)  # <PIL.Image.Image image mode=L size=960x626 at 0x1EB4768BF60>
print(b)  # <PIL.Image.Image image mode=L size=960x626 at 0x1EB47697320>

r.show()
g.show()
b.show()

7. 图像的点运算

可以实现整体变亮或者变暗的效果

im1 = im.point(lambda x: x * 1.8)
im1.show()

im2 = im.point(lambda x: x * 0.6)
im2.show()

8. 将图片转成灰度图片

im1 = im.convert("L")
im1.show()

这和 im.split 转化为单通道有点像，另外关于图片格式我们后面还会说。

图像过滤

可以使用 ImageFilter 来对图像进行细节上的增强、变换等等，当然还是对im进行操作，但是参数主要是ImageFilter这个模块提供的。这个模块提供很多的过滤器，通过指定不同的过滤器参数，来对图片进行不同的变换。

from PIL import Image
from PIL import ImageFilter

im = Image.open("古明地觉.jpg")

1. 图像模糊

# 图像模糊
im1 = im.filter(ImageFilter.BLUR)
im1.show()

2. 图像增强（细节突出）

im1 = im.filter(ImageFilter.DETAIL)
im1.show()

3. 图像边缘提取

im1 = im.filter(ImageFilter.FIND_EDGES)
im1.show()

4. 图像轮廓

im1 = im.filter(ImageFilter.CONTOUR)
im1.show()

5. 边缘增强滤波

增强不同灰度之间的边界和轮廓

im1 = im.filter(ImageFilter.EDGE_ENHANCE)
im1.show()

# 从名字也能看出来，作用一样，但是效果更强了
im2 = im.filter(ImageFilter.EDGE_ENHANCE_MORE)
im2.show()

6. 浮雕效果

im1 = im.filter(ImageFilter.EMBOSS)
im1.show()

7. 平滑滤波

突出图像的主干部分，减少突变

im1 = im.filter(ImageFilter.SMOOTH)
im1.show()

im2 = im.filter(ImageFilter.SMOOTH_MORE)
im2.show()

8. 锐化

im1 = im.filter(ImageFilter.SHARPEN)
im1.show()

图像过滤(高级用法)

1. ImageFilter.Kernel(size, kernel, scale=None, offset=0)，有点类似于TensorFlow里的卷积神经网络。

size：卷积核的尺寸，比如为(3, 3)或者(5, 5)
kernel：size为(3, 3)，那么kernel必须为由9个int或者float组成的元组。如果size为(5, 5),那么kernel为25个
scale：如果设置了，那么卷积核作用每个像素之后都要除以scale，默认是卷积核的权重之和
offset：卷积核作用于每个像素之后要加上offset再除以scale，默认是0

im1 = im.filter(ImageFilter.Kernel((3, 3), (1, 1, 1, 0, 1, 0, 1, 0, 1), scale=None, offset=0))
im1.show()

2. ImageFilter.Kernel(size, kernel, scale=None, offset=0)，有点类似于TensorFlow里的卷积。

生成等级滤波器，对于每一个像素点，等级滤波器根据像素值，在(size, size)的区域中对所有像素点进行排序，然后将对应等级的值拷贝到图像中。rank∈[0, size * size -1]，size * size * 0.5为中等

# 表示在每个像素点为中心的3*3区域组成的9个像素中，选择第7位的像素作为新值
im1 = im.filter(ImageFilter.RankFilter(3, 7))
im1.show()

3. ImageFilter.MinFilter(size)，和RankFilter类似，不过只需要指定一个size即可，会自动选择最小的，相当于rank=0。

im1 = im.filter(ImageFilter.MinFilter(3))
im1.show()

4. ImageFilter.MaxFilter(size)，和上一次一样，只不过是选取最大的。

im1 = im.filter(ImageFilter.MaxFilter(3))
im1.show()

5. ImageFilter.MedianFilter(size)，选取中间的。

im1 = im.filter(ImageFilter.MedianFilter(3))
im1.show()

5. ImageFilter.ModelFilter(size)，选择(size, size)中出现次数最多的像素值，如果没有出现两次或者两次以上的，就用原始的像素值。

im1 = im.filter(ImageFilter.ModeFilter(3))
im1.show()

im2 = im.filter(ImageFilter.ModeFilter(6))
im2.show()

size=3还可以，等于6就有点······

Image模块下的api

1. Image.eval

类似于im.point，这个函数会有一个返回值，不会在原来的图像上进行操作。

from PIL import Image

im = Image.open("古明地觉.jpg")

# 接收两个参数，Image对象，和函数
im1 = Image.eval(im, lambda x: x * 0.5)
im1.show()

2. Image.blend

图像融合，使用两张图像和一个透明度，融合成一张新的图像。注意：融合的时候，两张图像的尺寸必须要相同

from PIL import Image

im1 = Image.open("古明地觉.jpg").resize((600, 400))
im2 = Image.open("古明地恋.jpg").resize((600, 400))

im1.show()
im2.show()

from PIL import Image

im1 = Image.open("古明地觉.jpg").resize((600, 400))
im2 = Image.open("古明地恋.jpg").resize((600, 400))

"""
参数1：图像1
参数2：图像2
参数3：透明度alpha
合成公式：图像1 * (1 - alpha) + 图像2 * alpha
可以看出，如果alpha=0，那么结果就是图像1；alpha=1，结果就是图像2 
"""
im = Image.blend(im1=im1, im2=im2, alpha=0.6)
im.show()

3. Image.composite

将两张图片进行合成，和blend类似。

from PIL import Image

im1 = Image.open("古明地觉.jpg").resize((600, 400))
im2 = Image.open("古明地恋.jpg").resize((600, 400))

"""
参数1：图像1
参数2：图像2
参数3：mask,图像的一个通道。这是不再是透明度alpha
"""
im = Image.composite(image1=im1, image2=im2, mask=im1.split()[1])
im.show()

3. Image.merge

这个方法和split是对应的，split是将图片的三个通道进行分解，而merge是将三个通道进行融合，类似于pandas里面的merge。

from PIL import Image

im = Image.open("古明地觉.jpg")

r, g, b = im.split()

# 得到的r、g、b均是Image对象，所以可以使用对象的所有方法
r = r.point(lambda x: x * 1.3)  # r通道变为原来的1.3倍
g = g.point(lambda x: x * 0.9)  # g通道变为原来的0.9倍
b = b.point(lambda x: 0)  # g通道变为0

# 融合
# 接收两个参数
# 参数一：模式，这里直接使用原图的模式
# 参数二：三通道，要以元组的方式传入
print(im.mode)  # RGB
im1 = Image.merge(im.mode, (r, g, b))

im1.show()

得到了一个暖色调的图像。

4. 读取 gif 格式的图片

# 此外，Image.open()还可以读取gif格式
'''
im = Image.open("xxx.gif")
# 从序列中查找指定的帧，如果越界会抛出一个EOFError异常
# 当文件序列被打开，自动获取第零帧
# 这里显示第二帧
im.seek(2).show()
 
# 获取当前帧所处的位置，从0开始计算
im.tell()
'''

图片的变换

这里的方法是通过im对象调用的。

1. im.transform

图像可以有大小或者形状上的变化，主要是用 im.transform(size, method, data, filter)

size：新图像的尺寸
method：有EXTENT(裁剪一个矩形区域)，AFFINE(仿射变换)，QUAD等等，下面举例介绍
data：裁剪的区域，传入矩形的左上顶点和右下顶点
filter：滤波器，有NEAREST,BILINEAR,BICUBIC,ANTIALIAS。中间两个不常用，NEAREST速度最快，ANTIALIAS质量最高

from PIL import Image

im = Image.open("古明地觉.jpg")

"""
表示将im的(0, 0, 600, 600)这块区域裁剪出来，并且尺寸变为(300, 300)
我们裁剪的区域的宽和高为600和600，那么在变换的时候也要符合比例，不然会有拉伸和压缩
至于滤波器我们不用管，默认的就好

这种方法类似于im.crop但是速度上没有crop块，速度上类似于resize
这个方法是有返回值的
"""
im1 = im.transform((300, 300), Image.EXTENT, (0, 0, 600, 600))
im1.show()

from PIL import Image

im = Image.open("古明地觉.jpg")

"""
前两个参数不用说，关键是第三个参数
传入一个元组(a, b, c, d, e, f)那么原来的(x, y)就会被映射成(ax+by+c, dx+ey+f)
"""
im1 = im.transform((300, 300), Image.AFFINE, (1, 2, 1, 2, 1, 3))
im1.show()

from PIL import Image

im = Image.open("古明地觉.jpg")

"""
这个简单，就是输出图像的一个四边形
这里是图像的截取部分，需要传入左上、左下、右下、右上四个位置，个人觉得只需要传两个就可以了
"""
im1 = im.transform((300, 300), Image.QUAD, (0, 0, 0, 400, 500, 400, 500, 0))
im1.show()

from PIL import Image

im = Image.open("古明地觉.jpg")

"""
透视变化
和仿射类似，只不过最后一个元组需要传入8个值
(a, b, c, d, e, f, g, h),然后(x, y)会映射成( (ax+by+c)//(gx+hy+1), (dx+ey+f)//(gx+hy+1) )
"""
im1 = im.transform((300, 300), Image.PERSPECTIVE, (1, 1, 1, 1, 0, 0, 0, 0))
im1.show()

2. im.transpose

可以对图像进行翻转。

from PIL import Image

im = Image.open("古明地觉.jpg")


im1 = im.transpose(Image.FLIP_LEFT_RIGHT)  # 左右翻转
im2 = im.transpose(Image.FLIP_TOP_BOTTOM)  # 上下翻转
im1.show()
im2.show()

图像增强

PIL还提供了了一个专门用来增强图像的模块，叫ImageEnhance。操作也很简单：调用ImageEnhance下的某个方法，传入Image对象，也就是im，得到一个增强图像的对象，比如叫enh。然后调用enh.enhance方法，传入增强或者减弱的数值，变得到一个新的Image对象，可以直接调用show方法，或者Image.open()得到的对象的其他方法。

from PIL import Image, ImageEnhance

im = Image.open("古明地觉.jpg")

# 传入Image对象im，得到可以操作亮度的对象
enh = ImageEnhance.Brightness(im)

# 增强或者减弱亮度
enh.enhance(1.5).show()  # 增强为原来的1.5倍
enh.enhance(0.3).show()  # 减弱为原来的0.3倍

from PIL import Image, ImageEnhance

im = Image.open("古明地觉.jpg")

# 传入Image对象im，得到可以操作对比度的对象
enh = ImageEnhance.Contrast(im)

# 增强或者减弱对比度
enh.enhance(1.5).show()  # 增强为原来的1.5倍
enh.enhance(0.3).show()  # 减弱为原来的0.3倍

from PIL import Image, ImageEnhance

im = Image.open("古明地觉.jpg")

# 传入Image对象im，得到可以操作锐化的对象
enh = ImageEnhance.Sharpness(im)

# 增强或者减弱锐化
enh.enhance(20).show()  # 增强为原来的20倍
enh.enhance(0.5).show()  # 减弱为原来的0.5倍

from PIL import Image, ImageEnhance

im = Image.open("古明地觉.jpg")

# 传入Image对象im，得到可以操作颜色均衡的对象
enh = ImageEnhance.Color(im)

# 增强或者减弱颜色均衡
enh.enhance(5).show()  # 增强为原来的5倍
enh.enhance(0.5).show()  # 减弱为原来的0.5倍

图像加特技

PIL还为我们提供了ImageChops模块(channel operations)，可以对图像进行一些特效上的操作。

1. ImageChops.constant(image, value)

返回一个和image大小一样，像素值为value的层。

from PIL import Image, ImageChops

im = Image.open("古明地觉.jpg")

im1 = ImageChops.constant(im, 200)
im1.show()

2. ImageChops.dupicate(image)

返回给定图像的拷贝，类似于im.copy()。

from PIL import Image, ImageChops

im = Image.open("古明地觉.jpg")

im1 = ImageChops.duplicate(im)
im1.show()

3. ImageChops.invert(image)

返回一个新图像，新图像的每一个像素等于 255 减去原像素。

from PIL import Image, ImageChops

im = Image.open("古明地觉.jpg")

im1 = ImageChops.invert(im)
im1.show()

4. ImageChops.lighter(image1, image2)

将两个图片的像素逐个比较，选取较大的作为新图片的像素，两者尺寸可以不一样，尺寸相当于会取两者共有的部分。如果是600 * 400 和 700 * 300，那么得到结果会是 600 * 300。

from PIL import Image, ImageChops

im1 = Image.open("古明地觉.jpg")
im2 = Image.open("古明地恋.jpg")

im = ImageChops.lighter(im1, im2)
im1.show()
im2.show()
im.show()

4. ImageChops.darker(image1, image2)

从名字也能看出，选取较小的作为新像素。

from PIL import Image, ImageChops

im1 = Image.open("古明地觉.jpg")
im2 = Image.open("古明地恋.jpg")

im = ImageChops.darker(im1, im2)
im.show()

5. ImageChops.difference(image1, image2)

返回两个图片像素的绝对差值作为新图片的像素。

from PIL import Image, ImageChops

im1 = Image.open("古明地觉.jpg")
im2 = Image.open("古明地恋.jpg")

im = ImageChops.difference(im1, im2)
im.show()

6. ImageChops.mutiply(image1, image2)

两张图片进行融合，image1 * image2 / MAX，对应像素相乘，然后除以较大的像素。

from PIL import Image, ImageChops

im1 = Image.open("古明地觉.jpg")
im2 = Image.open("古明地恋.jpg")

im = ImageChops.multiply(im1, im2)
im.show()

7. ImageChops.screen(image1, image2)

将两张图片进行融合，这几个api比较类似，无非是像素的算法不一样，result = MAX - ((MAX - image1) * (MAX - image2) / MAX)。

from PIL import Image, ImageChops

im1 = Image.open("古明地觉.jpg")
im2 = Image.open("古明地恋.jpg")

im = ImageChops.screen(im1, im2)
im.show()

8. ImageChops.add(image1, image2)

result = (image1 + image2) / scale + offset。

from PIL import Image, ImageChops

im1 = Image.open("古明地觉.jpg")
im2 = Image.open("古明地恋.jpg")

im = ImageChops.add(im1, im2)
im.show()

im = ImageChops.add(im1, im2, 5)
im.show()

9. ImageChops.subtract(image1, image2)

result = (image1 - image2) / scale + offset。

from PIL import Image, ImageChops

im1 = Image.open("古明地觉.jpg")
im2 = Image.open("古明地恋.jpg")

im = ImageChops.subtract(im1, im2)
im.show()

im = ImageChops.subtract(im1, im2, 5)
im.show()

9. ImageChops.blend(image1, image2)

和Iamge模块的blend用法一样，将两张图像合并为一张,注意：此时要求图片尺寸一致。

from PIL import Image, ImageChops

im1 = Image.open("古明地觉.jpg").resize((600, 400))
im2 = Image.open("古明地恋.jpg").resize((600, 400))

im = ImageChops.blend(im1, im2, 0.5)
im.show()

10. ImageChops.composite(image1, image2, mask)

根据mask合成两张图像，mask可以是一个通道，和Image下的composite是一样的。同理，要求两张图片尺寸一致。

from PIL import Image, ImageChops

im1 = Image.open("古明地觉.jpg").resize((600, 400))
im2 = Image.open("古明地恋.jpg").resize((600, 400))

im = ImageChops.composite(im1, im2, im1.split()[0])
im.show()

im = ImageChops.composite(im1, im2, im1.split()[1])
im.show()

11. ImageChops.offset(image, xoffset, yoffset)

原图像(x,y) => 新图像(x+xoffset, y+yoffset)。

from PIL import Image, ImageChops

im = Image.open("古明地觉.jpg")
im1 = ImageChops.offset(im, 100, 200)
im1.show()

图像处理

PIL还提供了一个ImageOps模块，包含一些图像处理操作。

1. ImageOps.autocontrast(image, cutoff=0)

最大图像对比度。计算一个输入图像的直方图,image.histogram(),除去最亮和最暗的百分之cutoff，重新映射图像。

from PIL import Image, ImageOps

im = Image.open("古明地觉.jpg")
im1 = ImageOps.autocontrast(im, 15)
im1.show()

2. ImageOps.colorize(image, black, white)

使得灰色图像变为彩色图像，变量black和white应该是RGB元组或者颜色名称。这个函数会使得原图像的所有黑色变成black，所有白色变成white,前提是变量image的模式必须为L，使用im.split()会获取三个通道，那么每个通道的模式便为L。

from PIL import Image, ImageOps

im = Image.open("古明地觉.jpg").convert("L")

im1 = ImageOps.colorize(im, "pink", "green")
im1.show()

3. ImageOps.crop(image, border=0)

类似于im.crop()，但是参数不太一样，那个border依旧是一个元组，包含四个int。但不是矩形的左上和右下顶点，而是表示左上右下分别去掉多少行/列。

from PIL import Image, ImageOps

im = Image.open("古明地觉.jpg")

# 表示左边去掉200列，上边去掉100行，右边去掉300列，下边去掉200行
im1 = ImageOps.crop(im, border=(200, 100, 300, 200))
im1.show()

4. ImageOps.equalize(image)

产生一个灰色值均匀分布的图像。

from PIL import Image, ImageOps

im = Image.open("古明地觉.jpg")

im1 = ImageOps.equalize(im)
im1.show()

5. ImageOps.expand(image, border=0, fill=0)

和crop相反，expand表示扩充行/列，用fill指定的颜色填充。

from PIL import Image, ImageOps

im = Image.open("古明地觉.jpg")

im1 = ImageOps.expand(im, border=(100, 100, 100, 100), fill="pink")
im1.show()

6. ImageOps.fit(image, size, method, bleed, centering)

size：输出的尺寸
method：采样的方法，默认是NEARST，速度最快
bleed：去除边界（四个），需要传入一个百分比，如0.01，去除百分之一的边界。默认是0
centering：裁剪位置，(0.5,0.5)表示中心，(0, 0)左上角，(1.0, 0)左下角。(1.0, 1.0)右下角；所以：(0.5,0.5)，裁剪宽度，从右边开始，裁剪高度，从底部开始；(0,0)，裁剪宽度，从右边开始，裁剪高度，从底部开始；(1.0,0),裁剪宽度，从左边开始，裁剪高度，从底部开始

from PIL import Image, ImageOps

im = Image.open("古明地觉.jpg")

im1 = ImageOps.fit(im, (400, 400), Image.NEAREST, 0.3, (1.0, 0))
im1.show()

7. ImageOps.flip(image)

输出image在垂直方向的镜像。

from PIL import Image, ImageOps

im = Image.open("古明地觉.jpg")

im1 = ImageOps.flip(im)
im1.show()

8. ImageOps.mirror(image)

既然有垂直方向的镜像，那就肯定有水平方向上的。

from PIL import Image, ImageOps

im = Image.open("古明地觉.jpg")

im1 = ImageOps.mirror(im)
im1.show()

9. ImageOps.grayscale(image)

将彩色图像转化为灰度图像。

from PIL import Image, ImageOps

im = Image.open("古明地觉.jpg")

im1 = ImageOps.grayscale(im)
im1.show()

10. ImageOps.invert(image)

每一个像素都用255去减，和 ImageChops.invert() 功能一样。

from PIL import Image, ImageOps

im = Image.open("古明地觉.jpg")

im1 = ImageOps.invert(im)
im1.show()

11. ImageOps.posterize(image, bits)

将每个颜色通道值的低bits个位设置为0。

from PIL import Image, ImageOps

im = Image.open("古明地觉.jpg")

im1 = ImageOps.posterize(im, 10)
im1.show()

12. ImageOps.solarize(image,threshold=128)

在指定的阈值范围内，翻转所有的像素点。

from PIL import Image, ImageOps

im = Image.open("古明地觉.jpg")

im1 = ImageOps.solarize(im, threshold=128)
im1.show()

ImageDraw

ImageDraw是 PIL 里面的一个画笔，我们可以导入图像，也可以绘制图像。既然要绘制图像，那么肯定要有画笔啊。调用ImageDraw模块下的Draw方法，draw = ImageDraw(im)，传入的im也就是Image对象，就可以生成一个画笔，那么画笔所画的内容就会显示在im(画板)上。那么这个画板可以是image.open创建的Image对象，也可以是自己创建的Image对象。下面我们就来自己创建：

创建一个画板

from PIL import Image

"""
三个参数：
第一个参数：模式
第二个参数：画板的长和宽
第三个参数：画板的颜色，是一个三元组
"""
im = Image.new("RGB", (200, 80), (150, 155, 180))
im.show()

创建画笔

from PIL import Image
from PIL import ImageDraw

im = Image.new("RGB", (200, 80), (150, 155, 180))
# 此时变得到一个画笔，画笔所画的内容都会显示在im上面
draw = ImageDraw.Draw(im)

绘制直线

from PIL import Image
from PIL import ImageDraw

im = Image.new("RGB", (200, 80), (150, 155, 180))
draw = ImageDraw.Draw(im)
"""
line方法表示画一条直线，参数如下：
参数一：起点和终点位置，[x1, y1, x2, y2]
参数二：fill，用什么颜色填充，是一个rgb三元组
参数三：width：线条宽度
"""
draw.line([10, 10, 150, 80], fill=(150, 140, 255), width=2)
draw.line([20, 10, 50, 180], fill=(250, 40, 155), width=2)

im.show()

绘制曲线

from PIL import Image
from PIL import ImageDraw

im = Image.new("RGB", (800, 600), (100, 100, 100))
draw = ImageDraw.Draw(im)
"""
和绘制直线类似，但是坐标的意义不一样

参数一：起点和终点位置，和直线不一样，直线是两点确定一条直线，而曲线里的起点和终点，表示一个矩形的左上顶点和右下顶点
参数二：起始角度
参数三：终止角度

然后会根据参数一得到的矩形画出一个与矩形四边都想切的圆
然后根据起始角度和终止角度从满圆中截取相应的弧
并且规定相应矩形的水平中位线为零度角，然后顺时针变大

参数四：fill，填充颜色，rgb三元组,或者颜色名
参数五：width，线条宽度
"""
draw.arc([0, 0, 600, 400], 0, 360, fill="blue", width=2)
"""
如果矩形跑到了画板的外面，仍然会按照相应的规则画圆，截取
就假装有画板，只是显示的时候超出画板的部分不显示
有时候我们想画出一条曲线的时候，便可以采用这种办法
通过画圆的方式，然后截取一部分弧
"""
draw.arc([-100, -100, 1000, 200], 0, 360, fill="red", width=2)
im.show()

绘制圆或者椭圆

这个和上面的arc类似，其实arc也算是用来画圆的

from PIL import Image
from PIL import ImageDraw

im = Image.new("RGB", (800, 600), (100, 100, 100))
draw = ImageDraw.Draw(im)

"""
参数一：和arc的第一个参数是一样的
此时不需要起始和终止角度了，因为画的就是圆或者椭圆

参数二：fill，填充色，圆或者椭圆内部的颜色
参数三：outline，轮廓的颜色
参数四：width，线条的宽度
"""
draw.ellipse([100, 100, 600, 600], fill="blue")
draw.ellipse([100, 100, 500, 300], outline="red", width=2)
im.show()

draw.chord

用法和arc类似，只不过fill变成填充色，arc中的表示轮廓的fill在arc里面成为了outline

from PIL import Image
from PIL import ImageDraw

im = Image.new("RGB", (800, 600), (100, 100, 100))
draw = ImageDraw.Draw(im)

draw.chord([0, 0, 600, 400], 0, 360, fill="blue", width=2)

draw.arc([-100, -100, 1000, 200], 0, 360, fill="red", width=2)
im.show()

绘制扇形

参数和chord一样

from PIL import Image
from PIL import ImageDraw

im = Image.new("RGB", (800, 600), (100, 100, 100))
draw = ImageDraw.Draw(im)

draw.pieslice([100, 100, 600, 600], 0, 90, fill="cyan", width=3)

im.show()

绘制多边形

传入相应点的坐标，会将多个点依次相连

from PIL import Image
from PIL import ImageDraw

im = Image.new("RGB", (800, 600), (100, 100, 100))
draw = ImageDraw.Draw(im)

draw.polygon([(50, 60), (100, 100), (150, 50), (250, 600), (50, 60)], fill="cyan", outline="green")

im.show()

绘制矩形

from PIL import Image
from PIL import ImageDraw

im = Image.new("RGB", (800, 600), (100, 100, 100))
draw = ImageDraw.Draw(im)

draw.rectangle([100, 100, 400, 400], outline="green")
draw.rectangle([200, 200, 300, 300], fill="blue")

im.show()

字体对象

既然要画，肯定要有字体啊

from PIL import Image
from PIL import ImageFont

im = Image.new("RGB", (800, 600), (100, 100, 100))
"""
参数一：字体
参数二：大小，size
参数三：index，有的字体是一系列字体的组合index表示用第几个，一般不指定
"""
font = ImageFont.truetype(r"C:\Windows\Fonts\msth.ttc", 40)

绘制文字

from PIL import Image
from PIL import ImageFont
from PIL import ImageDraw

im = Image.new("RGB", (800, 600), "cyan")
draw = ImageDraw.Draw(im)
font = ImageFont.truetype(r"C:\Windows\Fonts\simkai.ttf", 40)

"""
使用text方法绘制文字
参数一：起始位置
参数二：文字，text
参数三：font，字体对象，如果不指定，则使用默认字体
参数四：fill，字体的填充颜色
"""
draw.text([100, 200], text="古明地觉最可爱", font=font, fill=(100, 185, 179))
im.show()

手动生成验证码

绘制噪点

from PIL import Image
from PIL import ImageFont
from PIL import ImageDraw
import random
import string

# 随机生成一个画板颜色
bg_color = random.randint(0, 256), random.randint(0, 256), random.randint(0, 256)
# 定义画板的宽和高
width, height = 200, 80

# 创建画板
im = Image.new("RGB", (width, height), bg_color)

# 创建画笔对象，接收画板对象，这样一来，画笔所画的内容都会显示在画板上。
draw = ImageDraw.Draw(im)

# 绘制噪点，不要过多，一般为宽乘高再乘以0.1
for _ in range(int(width * height * 0.1)):
    # 噪点的横纵坐标
    x_y_point = random.randint(0, width), random.randint(0, height)
    # 填充色，尽量随机
    fill = random.randint(0, 256), random.randint(0, 256), random.randint(0, 256)
    # 绘制
    draw.point(x_y_point, fill)
    
# 先来看看画板长啥样
im.show()

可以看到噪点此刻绘制出来了，在为其绘制几条直线和曲线

from PIL import Image
from PIL import ImageFont
from PIL import ImageDraw
import random
import string

bg_color = random.randint(0, 256), random.randint(0, 256), random.randint(0, 256)
width, height = 200, 80

im = Image.new("RGB", (width, height), bg_color)

draw = ImageDraw.Draw(im)

for _ in range(int(width * height * 0.1)):
    x_y_point = random.randint(0, width), random.randint(0, height)
    fill = random.randint(0, 256), random.randint(0, 256), random.randint(0, 256)
    draw.point(x_y_point, fill)

for _ in range(5):
    """
    直线的长度要从画板的左边到，画板的右边
    因此左端点要在画板左侧上下变化
    因此右端点要在画板右侧上下变化
    """
    left_pos = 0, random.randint(0, height)
    right_pos = width, random.randint(0, height)
    fill = random.randint(0, 256), random.randint(0, 256), random.randint(0, 256)
    draw.line([left_pos, right_pos], fill=fill)

# 再为其绘制几条曲线
for _ in range(5):
    """
    这里我们要超出画板
    这样最终在画板上显示的部分只是大圆的一条弧，看起来就像是一条曲线
    不然整个圆都显示的话，就不是我们想要的曲线了
    """
    left_pos = (-100, -100)
    right_pos = (width * 5, random.randint(0, height))
    fill = random.randint(0, 256), random.randint(0, 256), random.randint(0, 256)
    draw.arc([left_pos, right_pos], 0, 360, fill=fill)

# 来看看长什么样
im.show()

可以看到，背景的噪点和线段已经绘制完成，下面开始绘制文字

 
from PIL import Image
from PIL import ImageFont
from PIL import ImageDraw
import random
import string

bg_color = random.randint(0, 256), random.randint(0, 256), random.randint(0, 256)
width, height = 200, 80

im = Image.new("RGB", (width, height), bg_color)

draw = ImageDraw.Draw(im)

for _ in range(int(width * height * 0.1)):
    x_y_point = random.randint(0, width), random.randint(0, height)
    fill = random.randint(0, 256), random.randint(0, 256), random.randint(0, 256)
    draw.point(x_y_point, fill)

for _ in range(5):
    left_pos = 0, random.randint(0, height)
    right_pos = width, random.randint(0, height)
    fill = random.randint(0, 256), random.randint(0, 256), random.randint(0, 256)
    draw.line([left_pos, right_pos], fill=fill)

for _ in range(5):
    left_pos = (-100, -100)
    right_pos = (width * 5, random.randint(0, height))
    fill = random.randint(0, 256), random.randint(0, 256), random.randint(0, 256)
    draw.arc([left_pos, right_pos], 0, 360, fill=fill)

# 验证码是由文字和数字组成，先来获取所有的数字和字母
alpha_digit = string.ascii_letters + string.digits
# 验证码一般是四个字符，从里面随机选取4个
verify_code = random.sample(alpha_digit, 4)
# 生成字体对象
font = ImageFont.truetype(r"C:\Windows\Fonts\simkai.ttf", 40)
# 为四个字符创建四种颜色
color = [(random.randint(0, 256), random.randint(0, 256), random.randint(0, 256)) for _ in range(4)]

# 绘制文字
# 注意：坐标加上字体的宽度不要超出画板，否则显示不全
draw.text([10, 10], verify_code[0], font=font, fill=color[0])
draw.text([60, 25], verify_code[1], font=font, fill=color[1])
draw.text([110, 15], verify_code[2], font=font, fill=color[2])
draw.text([150, 25], verify_code[3], font=font, fill=color[3])

# 释放画笔
del draw

# 再来查看一下
im.show()

验证码便被成功的绘制出来了。

保存图片

我们之前的所有案例，都是调用show方法，自动将图片打开。如果我想将图片保存起来呢？要怎么做呢？

from PIL import Image
import random

bg_color = random.randint(0, 256), random.randint(0, 256), random.randint(0, 256)
width, height = 200, 80

im = Image.new("RGB", (width, height), bg_color)

# 如果我想将im保存起来的话，可以使用save方法
# 指定文件名和格式
im.save("本地路径.jpg", format="png")

这是一种方法，但是我们生成验证码是为了放在网站使用的，不可能先生成到本地，然后再读取。因此我们可以把字节流放到缓存里。

from PIL import Image
import random
from io import BytesIO

bg_color = random.randint(0, 256), random.randint(0, 256), random.randint(0, 256)
width, height = 200, 80

im = Image.new("RGB", (width, height), bg_color)

buf = BytesIO()
# save方法除了传递本地路径，也可以传递一个缓存，这样字节流就都被放到了缓存里
im.save(buf, "png")

# 有了缓存，那么我们就可以直接在网站上渲染出验证码图片。比如Django
# 我们就可以使用return HttpResponse(buf.getvalue(), "image/png"),直接渲染到页面上

# 这里我们就用文件演示吧
with open("1.png", "wb") as f:
    f.write(buf.getvalue())

图片转成字符画

from PIL import Image
def get_char(r, g, b, alpha=256):
    # 这些字符串是用来和图片的像素进行匹配的
    ascii_char = '''$@B%8&WM#*oahkbdpqwmZO0QLCJUYXzcvunxrjft/\|()1{}[]?-_+~<>i!lI;:,\"^`'. '''
    if alpha == 0:
        return " "
    # 别问我为什么要这样进行映射，我也不知道
    length = len(ascii_char)
    gray = int(0.2126 * r + 0.7152 * g + 0.0722 * b)
    unit = (256.0+1)/length
    return ascii_char[int(gray/unit)]
 
def get_img(img: str, n: int):
    im = Image.open(img)
    # 有的时候，图片太大了，生成的txt文件没办法全部显示，需要拖动滚动条
    # 显然这样不爽，因此我们可以适当的缩小
    # 具体缩小多少倍，看图片的情况
    height = int(im.size[1]/n)
    width = int(im.size[0]/n)
  
    im = im.resize((width, height), Image.NEAREST)
    txt = ""
    for h in range(height):
        for w in range(width):
            # 获取每一个像素的三原色，匹配相应的字符
            txt += get_char(*im.getpixel((w, h)))
        # 注意换行，不然每一行的像素都合在一行了
        txt += "\n"
    return txt
 
# 调用main函数，只需传入图片，和生成的txt文件名以及缩小的倍数即可
def main(image_name: str, art_name: str, n: int=1):
    txt = get_img(image_name, n)
    with open(art_name, "w", encoding="utf-8") as f:
        f.write(txt)
if __name__ == '__main__':
    main(r"C:\Users\Administrator\Desktop\kanade.jpg", r"C:\Users\Administrator\Desktop\kanade.txt")

生成 GIF

from PIL import Image
from pathlib import Path

# 所有图片都在这个文件夹里面
path = Path(r"C:\Users\satori\Desktop\matplotlib\pic\38_frames")
# 用于存放图片读取之后的字节流
images = []
for p in path.glob(r"*.png"):
    # 读取
    img = Image.open(str(p))
    # 存到列表里面
    images.append(img)


# 使用列表里面第一个Image.open得到对象进行保存即可，但这只是一张图片读取之后的字节流啊
# 所以我们这里要有save_all=True，将所有的字节流保存为一张图片
# 但是这样还不够，将哪里的所有的字节流，所以还要指定一个append_images就是我们保存字节流的列表，这里是images
# 表示将images列表里面所有的字节流合成一张gif
# duration：间隔
images[0].save(r"C:\Users\satori\Desktop\matplotlib\pic\38_frames\a.gif", save_all=True, append_images=images, duration=0.2)

补充：图像的一些格式

在PIL中，彩色图片，打开之后返回的对象模式为RGB或者RGBA，灰度图像，返回对象的模式为L。一般情况我们可以使用Image.open打开任意格式的图片，然后保存的时候保存为想要的格式。但是Imgae对象可以直接转换格式，在PIL中共有1，L，P，RGB，RGBA，CMYK，YCbCr，I，F九种格式。

from PIL import Image


im = Image.open("蕾姆.png")
im.show()

from PIL import Image


im = Image.open("蕾姆.png")
im1 = im.convert("1")
print(im1.mode)  # 1
im1.show()

from PIL import Image


im = Image.open("蕾姆.png")
im1 = im.convert("L")
"""
L = r * 299 / 1000 + g * 587 / 1000 + b * 114 / 1000
"""
print(im1.mode)  # L
im1.show()

from PIL import Image


im = Image.open("蕾姆.png")
im1 = im.convert("P")
print(im1.mode)  # P
im1.show()

from PIL import Image


im = Image.open("蕾姆.png")
im1 = im.convert("RGBA")
"""
模式rgba为32位彩色图像，它的每个像素用32个bit表示，
其中24bit表示红色、绿色、蓝色三个通道，另外8位表示alpha通道，即透明通道
"""
print(im1.mode)  # RGBA
im1.show()

from PIL import Image


im = Image.open("蕾姆.png")
im1 = im.convert("CMYK")
"""
模式cmyk为32位彩色图像，它的每个像素用32位表示
模式cmyk就是印刷四分色模式，它是彩色印刷是所采用的一种套色模式
利用色料的三原色混色原理，加上黑色油墨，共计四种颜色混合叠加，形成所谓的'全彩印刷'
C = 255 - R
M = 255 - G
Y = 255 - B
K = 0
"""
print(im1.mode)  # CMYK
im1.show()

from PIL import Image


im = Image.open("蕾姆.png")
im1 = im.convert("YCbCr")
"""
模式YCbCr为24位彩色图像，它的每个像素用24位表示
YCbCr其中Y是指亮度分量，Cb是指蓝色色度分量，而Cr是指红色色度分量
人的肉眼对Y分量更加敏感，因此在通过对色度分量进行子采样来减少色度分量后，肉眼将察觉不到图像的质量变化
Y = 0.257 * R + 0.504 * G + 0.098 * B + 16
Cb = -0.148 * R - 0.291 * G + 0.439 * B + 128
Cr = 0.439 * R - 0.368 * G - 0.071 * B + 128
"""
print(im1.mode)  # YCbCr
im1.show()

from PIL import Image


im = Image.open("蕾姆.png")
im1 = im.convert("I")
"""
模式I为32位整型灰色图像，它的每个像素用32位表示
0表示灰，255表示白，(0, 255)之间的数字表示不同的灰度
I = R * 299 / 1000 + G * 587 / 1000 + B * 114 / 1000 
"""
print(im1.mode)  # I
im1.show()

from PIL import Image


im = Image.open("蕾姆.png")
im1 = im.convert("F")
"""
模式I为32位浮点灰色图像，它的每个像素用32位表示
0表示灰，255表示白，(0, 255)之间的数字表示不同的灰度
F = R * 299 / 1000 + G * 587 / 1000 + B * 114 / 1000

模式F和模式L的转换公式是一样的，都是RGB转成灰色值的公式
但模式F会保留小数的部分 
"""
print(im1.mode)  # F
im1.show()

PIL还有一些其他的模块，这里就不介绍了，因为不常用(其实是你懒)，目前的这些对于基本的图像处理应该足够了，当然如果后续想到了，会继续添加。

posted @ 2019-06-30 23:28 古明地盆阅读(3673) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

来自东方地灵殿的小提琴手

愿时间能带走痛苦