1. 应用K-means算法进行图片压缩

读取一张图片

观察图片文件大小,占内存大小,图片数据结构,线性化

kmeans对图片像素颜色进行聚类

获取每个像素的颜色类别,每个类别的颜色

压缩图片生成:以聚类中收替代原像素颜色,还原为二维

观察压缩图片的文件大小,占内存大小

from sklearn.cluster import KMeans

import matplotlib.pyplot as plt

import sys

import matplotlib.image as img

import numpy as np

 

# 读取一张图片

image = img.imread("./1.jpg")

print('原图片文件大小:', image.size)

print('原图片占内存大小:', sys.getsizeof(image))

print('原图片的数据结构:\n', image)

 

plt.rcParams['font.sans-serif'] = ['SimHei']#解决中文问题

plt.title("原图片")

plt.imshow(image)

plt.show()

 

# 用kmeans对图片像素颜色进行聚类

image = image[::3, ::3]  # 降低分辨率

X = image.reshape(-1, 3)

print(image.shape, X.shape)

n_colors = 64

model = KMeans(n_colors)

labels = model.fit_predict(X)  # 获取每个像素的颜色类别

colors = model.cluster_centers_  # 获取每个类别的颜色

 

new_image = colors[labels].reshape(image.shape)  # 以聚类中收替代原像素颜色,还原为二维

print('压缩图片文件大小:', new_image.size)

print('压缩图片占内存大小:', sys.getsizeof(new_image))

print('压缩图片的数据结构:\n', new_image)

img.imsave('E://1.jpg', new_image)

plt.title("压缩图片")

plt.imshow(new_image.astype(np.uint8))  # 把颜色平均值转为整数

plt.show()

 

 

 

2. 观察学习与生活中可以用K均值解决的问题。

从数据-模型训练-测试-预测完整地完成一个应用案例。

这个案例会作为课程成果之一,单独进行评分。

用于收集房的信息,估算房价

(1)收集数据

两千多条数据

 

 

 

 

处理数据

 

 

 

 

(2)模型训练-测试-预测