【第4次作业】CNN实战

【第4次作业】CNN实战

1. 下载数据

训练集包含1800张图(猫的图片900张，狗的图片900张)，测试集包含2000张图。

2. 数据处理

datasets 是 torchvision 中的一个包，可以用做加载图像数据。它可以以多线程（multi-thread）的形式从硬盘中读取数据，使用 mini-batch 的形式，在网络训练中向 GPU 输送。在使用CNN处理图像时，需要进行预处理。图片将被整理成 $224\times 224 \times 3$ 的大小，同时还将进行归一化处理。

3. 创建 VGG Model

直接使用预训好的VGG模型，并下载了ImageNet 1000 个类的 JSON 文件。

在这部分代码中，对输入的5个图片利用VGG模型进行预测，同时，使用softmax对结果进行处理，随后展示了识别结果。可以看到，识别结果是比较非常准确的。

4. 修改最后一层，冻结前面层的参数

为了在训练中冻结前面层的参数，需要设置 required_grad=False。这样，反向传播训练梯度时，前面层的权重就不会自动更新了。训练中，只会更新最后一层的参数。

使用预训练好的模型，因此，需要把最后的 nn.Linear 层由1000类，替换为2类

然后使用LogSoftmax函数使之变成概率的形式

5. 训练并测试全连接层

第1步，创建损失函数和优化器；

第2步，训练模型；

第3步，测试模型。

6. 可视化模型预测结果（主观分析）

主观分析就是把预测的结果和相对应的测试图像输出出来看看

下载比赛的测试集（包含2000张图片），利用fine-tune的VGG模型进行测试，按照比赛规定的格式输出，上传结果评测

下载测试集并在colab上解压后对模型进行测试

将结果到处到result.csv

提交结果

优化改进

在修改最后一层，冻结前面层的参数后，开始模型训练时，可以将训练的轮数改高一点，这里把epochs从1改成了3，，训练的正确率达到了0.9550

但是后面测试猫狗大战的时间会很久。。

posted @ 2021-10-23 13:35 Chengsiouc 阅读(172) 评论(0) 收藏举报

刷新页面返回顶部