NiN模型

import torch
from torch import nn
from d2l import torch as d2l
def NiN_block(in_chanels,out_chanels,kernel_size,padding,stride):#NiN块
    return nn.Sequential(
        nn.Conv2d(in_chanels,out_chanels,kernel_size,padding=padding,stride=stride),
        nn.ReLU(),
        nn.Conv2d(out_chanels,out_chanels,kernel_size=1),
        nn.ReLU(),
        nn.Conv2d(out_chanels,out_chanels,kernel_size=1),
        nn.ReLU()
    )
    #NiN网络
net=nn.Sequential(
    NiN_block(1,96,11,stride=4,padding=0),
    nn.MaxPool2d(kernel_size=3,stride=2),
    NiN_block(96,256,kernel_size=5,padding=2,stride=1),
    nn.MaxPool2d(kernel_size=3,stride=2),
    NiN_block(256,384,kernel_size=3,padding=1,stride=1),
    nn.MaxPool2d(kernel_size=3,stride=2),
    nn.Dropout(p=0.5),
    NiN_block(384,10,3,1,1),#输出通道最终为10，因为等会要用于数字0~9分类
    nn.AdaptiveAvgPool2d((1,1)),
    nn.Flatten()
)
X=torch.rand((1,1,224,224))
for layer in net:
    X=layer(X)
    print(layer.__class__.__name__,X.shape)

解释分析：

nn.AdaptiveAvgPool2d((1, 1)) 是 PyTorch 中的自适应平均池化层，它的作用是将输入的任意尺寸的特征图，通过平均池化操作，固定输出为 (1, 1) 大小的特征图（即高和宽都为 1）。

具体解释：

自适应（Adaptive）：

与普通的 nn.AvgPool2d 不同，它不需要手动指定池化核的大小（kernel_size）和步长（stride），而是直接指定输出特征图的尺寸。PyTorch 会自动计算所需的池化核大小和步长，以确保输出符合指定尺寸。
参数 (1, 1)：

表示输出特征图的高和宽都为 1。例如：
- 如果输入是形状为 (N, C, H, W) 的特征图（N 是批量大小，C 是通道数，H 是高，W 是宽），
- 经过 nn.AdaptiveAvgPool2d((1, 1)) 后，输出形状会变为 (N, C, 1, 1)。
在你的代码中的作用：

在 NiN 网络中，最后一个 NiN_block 的输出通道数是 10（对应 10 个类别），假设此时特征图形状为 (N, 10, H, W)（例如经过前面的层后，H 和 W 可能是 7 左右）。

通过 nn.AdaptiveAvgPool2d((1, 1)) 后，特征图会被压缩为 (N, 10, 1, 1)，再经过 nn.Flatten() 展平为 (N, 10)，正好对应 10 个类别的输出，可直接用于分类任务（如计算交叉熵损失）。

简单说，这个层的核心作用是 **“压缩空间维度，保留通道信息”**，方便后续将特征图转换为分类所需的向量形式。

二.训练NiN网络

import torch
from torch import nn
from d2l import torch as d2l
def NiN_block(in_chanels,out_chanels,kernel_size,padding,stride):
    return nn.Sequential(
        nn.Conv2d(in_chanels,out_chanels,kernel_size,padding=padding,stride=stride),
        nn.ReLU(),
        nn.Conv2d(out_chanels,out_chanels,kernel_size=1),
        nn.ReLU(),
        nn.Conv2d(out_chanels,out_chanels,kernel_size=1),
        nn.ReLU()
    )
net=nn.Sequential(
    NiN_block(1,96,11,stride=4,padding=0),
    nn.MaxPool2d(kernel_size=3,stride=2),
    NiN_block(96,256,kernel_size=5,padding=2,stride=1),
    nn.MaxPool2d(kernel_size=3,stride=2),
    NiN_block(256,384,kernel_size=3,padding=1,stride=1),
    nn.MaxPool2d(kernel_size=3,stride=2),
    nn.Dropout(p=0.5),
    NiN_block(384,10,3,1,1),#输出通道最终为10，因为等会要用于数字0~9分类
    nn.AdaptiveAvgPool2d((1,1)),
    nn.Flatten()
)
batch_size=128#批量数
train_iter,test_iter=d2l.load_data_fashion_mnist(batch_size,resize=224)
lr=0.05#学习率
nums_epochs=10#学习10代
d2l.train_ch6(net,train_iter,test_iter,nums_epochs,lr,d2l.try_gpu())#这个函数封装在d2l（本书的一个包）

posted @ 2025-10-16 23:16 Annaprincess 阅读(8) 评论(0) 收藏举报

刷新页面返回顶部

luckyyaoyao

NiN模型

NiN模型

具体解释：

二.训练NiN网络

公告