6-4 多输入多输出通道

1.多输入通道

import torch
from d2l import torch as d2l
def corr2d_multi_in(X, K):
    # 先遍历 X 和 K 的第0个维度（通道维度），再把他们加在一起
    
    # 把所有配对得到的互相关结果逐元素相加，得到一个总的输出特征图。
    # 把输入列表 X 和核列表 K 按位置配对，返回一个迭代器，每次取出一个 (x, k) 对。
    return sum(d2l.corr2d(x, k) for x, k in zip(X, K))

# 构造输入张量X和核张量K
X = torch.tensor([[[0.0, 1.0, 2.0], [3.0, 4.0, 5.0],[6.0, 7.0, 8.0]],
                 [[1.0, 2.0, 3.0], [4.0, 5.0, 6.0], [7.0, 8.0, 9.0]]])
K = torch.tensor([[[0.0, 1.0], [2.0, 3.0]],[[1.0, 2.0],[3.0, 4.0]]])

corr2d_multi_in(X, K)

tensor([[ 56.,  72.],
        [104., 120.]])

2.多输出通道

代码片段	含义
`K`	是一个 list of kernels，即 `K = [k0, k1, …, k_{out-1}]`，每个 `k_i` 是一个多通道核（形状为 `(C_in, kH, kW)`）。
`corr2d_multi_in(X, k)`	对多通道输入 `X`（形状 `(C_in, H, W)`）和多通道核 `k` 做“多输入单输出”的卷积，返回一个 2-D 特征图（形状 `(H_out, W_out)`）。
`[corr2d_multi_in(X, k) for k in K]`	用每个核 `k` 都算一次，得到 `len(K)` 个 2-D 特征图，组成一个 list of 2-D tensors。
`torch.stack(..., 0)`	把这些 2-D 张量沿着第 0 维（新维度）堆叠，形成一个 3-D 张量，形状为 `(C_out, H_out, W_out)`，其中 `C_out = len(K)`。

def corr2d_multi_in_out(X, K):
    # 迭代 K 的第0个维度，每次都对输入 X 执行互相关运算
    # 最后将所有结果都叠加在一起
    return torch.stack([corr2d_multi_in(X, k) for k in K], 0)

K = torch.stack((K, K+1, K+2), 0)
K.shape

torch.Size([3, 2, 2, 2])

corr2d_multi_in_out(X, K)

tensor([[[ 56.,  72.],
         [104., 120.]],

        [[ 76., 100.],
         [148., 172.]],

        [[ 96., 128.],
         [192., 224.]]])

1x1 卷积层

def corr2d_multi_in_out_1x1(X, K):
    c_i, h, w = X.shape
    c_o = K.shape[0]
    X = X.reshape((c_i, h*w))
    K = K.reshape((c_o, c_i))
    # 全连接层中的矩阵乘法
    Y = torch.matmul(K, X)
    return Y.reshape((c_o, h, w))

X = torch.normal(0, 1, (3, 3, 3))

从标准正态分布 N(0,1) 里随机采样
得到一个 3×3×3 的张量
含义：3 个通道，每个通道是 3×3 的 feature map
形状等价于 (C_in, H, W) = (3, 3, 3)

K = torch.normal(0, 1, (2, 3, 1, 1))

同样从 N(0,1) 采样
得到一个 2×3×1×1 的张量
含义：2 个卷积核，每个核有 3 个通道，大小是 1×1
形状等价于 (C_out, C_in, kH, kW) = (2, 3, 1, 1)

# 验证
X = torch.normal(0, 1, (3, 3, 3))
K = torch.normal(0, 1, (2, 3, 1, 1))

Y1 = corr2d_multi_in_out_1x1(X, K)
Y2 = corr2d_multi_in_out(X, K)
assert float(torch.abs(Y1-Y2).sum()) < 1e-16
print(Y1)
print(Y2)

tensor([[[-0.1984,  2.5553,  1.5839],
         [-0.2058,  1.2268, -0.9894],
         [ 0.2426, -0.1919, -1.0239]],

        [[-0.4502, -2.3320, -0.1471],
         [-0.0087,  0.0856,  1.3771],
         [-0.5613, -2.6421,  0.3126]]])
tensor([[[-0.1984,  2.5553,  1.5839],
         [-0.2058,  1.2268, -0.9894],
         [ 0.2426, -0.1919, -1.0239]],

        [[-0.4502, -2.3320, -0.1471],
         [-0.0087,  0.0856,  1.3771],
         [-0.5613, -2.6421,  0.3126]]])

posted @ 2025-09-21 23:35 小西贝の博客阅读(12) 评论(0) 收藏举报

刷新页面返回顶部

xxb667

6-4 多输入多输出通道

1.多输入通道

2.多输出通道

1x1 卷积层

公告