6-4 多输入多输出通道

1.多输入通道

import torch
from d2l import torch as d2l
def corr2d_multi_in(X, K):
    # 先遍历 X 和 K 的第0个维度(通道维度),再把他们加在一起
    
    # 把所有配对得到的互相关结果逐元素相加,得到一个总的输出特征图。
    # 把输入列表 X 和核列表 K 按位置配对,返回一个迭代器,每次取出一个 (x, k) 对。
    return sum(d2l.corr2d(x, k) for x, k in zip(X, K))
# 构造输入张量X和核张量K
X = torch.tensor([[[0.0, 1.0, 2.0], [3.0, 4.0, 5.0],[6.0, 7.0, 8.0]],
                 [[1.0, 2.0, 3.0], [4.0, 5.0, 6.0], [7.0, 8.0, 9.0]]])
K = torch.tensor([[[0.0, 1.0], [2.0, 3.0]],[[1.0, 2.0],[3.0, 4.0]]])

corr2d_multi_in(X, K)
tensor([[ 56.,  72.],
        [104., 120.]])

2.多输出通道

代码片段 含义
K 是一个 list of kernels,即 K = [k0, k1, …, k_{out-1}],每个 k_i 是一个 多通道核(形状为 (C_in, kH, kW))。
corr2d_multi_in(X, k) 对多通道输入 X(形状 (C_in, H, W))和多通道核 k 做“多输入单输出”的卷积,返回一个 2-D 特征图(形状 (H_out, W_out))。
[corr2d_multi_in(X, k) for k in K] 用每个核 k 都算一次,得到 len(K) 个 2-D 特征图,组成一个 list of 2-D tensors
torch.stack(..., 0) 把这些 2-D 张量沿着 第 0 维(新维度) 堆叠,形成一个 3-D 张量,形状为 (C_out, H_out, W_out),其中 C_out = len(K)
def corr2d_multi_in_out(X, K):
    # 迭代 K 的第0个维度,每次都对输入 X 执行互相关运算
    # 最后将所有结果都叠加在一起
    return torch.stack([corr2d_multi_in(X, k) for k in K], 0)
K = torch.stack((K, K+1, K+2), 0)
K.shape
torch.Size([3, 2, 2, 2])
corr2d_multi_in_out(X, K)
tensor([[[ 56.,  72.],
         [104., 120.]],

        [[ 76., 100.],
         [148., 172.]],

        [[ 96., 128.],
         [192., 224.]]])

1x1 卷积层

def corr2d_multi_in_out_1x1(X, K):
    c_i, h, w = X.shape
    c_o = K.shape[0]
    X = X.reshape((c_i, h*w))
    K = K.reshape((c_o, c_i))
    # 全连接层中的矩阵乘法
    Y = torch.matmul(K, X)
    return Y.reshape((c_o, h, w))
  1. X = torch.normal(0, 1, (3, 3, 3))
  • 从标准正态分布 N(0,1) 里随机采样
  • 得到一个 3×3×3 的张量
  • 含义:3 个通道,每个通道是 3×3 的 feature map
    形状等价于 (C_in, H, W) = (3, 3, 3)
  1. K = torch.normal(0, 1, (2, 3, 1, 1))
  • 同样从 N(0,1) 采样
  • 得到一个 2×3×1×1 的张量
  • 含义:2 个卷积核,每个核有 3 个通道,大小是 1×1
    形状等价于 (C_out, C_in, kH, kW) = (2, 3, 1, 1)
# 验证
X = torch.normal(0, 1, (3, 3, 3))
K = torch.normal(0, 1, (2, 3, 1, 1))
Y1 = corr2d_multi_in_out_1x1(X, K)
Y2 = corr2d_multi_in_out(X, K)
assert float(torch.abs(Y1-Y2).sum()) < 1e-16
print(Y1)
print(Y2)
tensor([[[-0.1984,  2.5553,  1.5839],
         [-0.2058,  1.2268, -0.9894],
         [ 0.2426, -0.1919, -1.0239]],

        [[-0.4502, -2.3320, -0.1471],
         [-0.0087,  0.0856,  1.3771],
         [-0.5613, -2.6421,  0.3126]]])
tensor([[[-0.1984,  2.5553,  1.5839],
         [-0.2058,  1.2268, -0.9894],
         [ 0.2426, -0.1919, -1.0239]],

        [[-0.4502, -2.3320, -0.1471],
         [-0.0087,  0.0856,  1.3771],
         [-0.5613, -2.6421,  0.3126]]])

posted @ 2025-09-21 23:35  小西贝の博客  阅读(12)  评论(0)    收藏  举报