【625】keras.utils.Sequence 制作生成集
用于拟合数据序列的基对象,例如一个数据集。
每一个 Sequence 必须实现 __getitem__ 和 __len__ 方法。 如果你想在迭代之间修改你的数据集,你可以实现 on_epoch_end。 __getitem__ 方法应该范围一个完整的批次。
例子
from skimage.io import imread
from skimage.transform import resize
import numpy as np
# 这里,`x_set` 是图像的路径列表
# 以及 `y_set` 是对应的类别
class DataGenerator(Sequence):
# 初始化类
def __init__(self, x_set, y_set, batch_size):
self.x, self.y = x_set, y_set
self.batch_size = batch_size
# 返回batch_size的个数,也就是完整跑一遍数据要运行模型多少次
def __len__(self):
return int(np.ceil(len(self.x) / float(self.batch_size)))
# 返回一个batch_size的数据 (data, label)
# 直接输入到模型的形式
# input: (2, 512, 512, 3)
# label: (2, 512, 512, 1)
def __getitem__(self, idx):
batch_x = self.x[idx * self.batch_size:(idx + 1) * self.batch_size]
batch_y = self.y[idx * self.batch_size:(idx + 1) * self.batch_size]
# 获取一个批次的全部数据,并构建为x_arr
x_arr = []
for file_name in batch_x:
img = resize(imread(file_name), (200, 200))
x_arr.append(np.array(img))
x = np.array(x_arr)
y = np.array(batch_y)
return x, y
浙公网安备 33010602011771号