摘要:
本章围绕医学影像数据加载展开,核心是将 LUNA16 数据集的 CT 扫描文件(.mhd/.raw)与 CSV 标注文件转换为 PyTorch 可用的训练样本。首先合并并匹配候选结节标注信息,通过 Ct 类加载 CT 数据并裁剪 HU 值至合理范围,完成病人坐标系(XYZ)与数组坐标系(IRC)的转换;接着自定义 LunaDataset 类实现数据集核心方法,采用内存 + 磁盘缓存策略优化性能,按步长采样划分训练 / 验证集;最终输出包含候选区域张量、分类标签等的标准化训练样本,形成完整的数据准备流水线。 阅读全文
本章围绕医学影像数据加载展开,核心是将 LUNA16 数据集的 CT 扫描文件(.mhd/.raw)与 CSV 标注文件转换为 PyTorch 可用的训练样本。首先合并并匹配候选结节标注信息,通过 Ct 类加载 CT 数据并裁剪 HU 值至合理范围,完成病人坐标系(XYZ)与数组坐标系(IRC)的转换;接着自定义 LunaDataset 类实现数据集核心方法,采用内存 + 磁盘缓存策略优化性能,按步长采样划分训练 / 验证集;最终输出包含候选区域张量、分类标签等的标准化训练样本,形成完整的数据准备流水线。 阅读全文
posted @ 2026-01-22 22:14
榴红八色鸫
阅读(5)
评论(0)
推荐(0)

首先介绍了卷积相对于全连接的三大优势:局部操作、平移不变性和参数量大幅减少。接着讲解了如何通过子类化 nn.Module 自定义模型,重点区分了函数式 API 与模块化 API 的使用场景——有参数的层用模块化,无参数的操作用函数式。最后探讨了三种模型改进策略:增加通道数扩展宽度、使用权重惩罚/Dropout/批量归一化进行正则化、以及通过跳跃连接构建更深的网络以解决梯度消失问题。文末提供了完整的 ResNet 风格网络代码实现。
本文以区分CIFAR-10数据集中的鸟和飞机图像为实战目标,通过PyTorch完整演示深度学习流程。首先加载数据并预处理:将PIL图像转为张量,计算通道均值与标准差进行标准化,筛选出目标类别构建简化数据集;随后设计输入层(3072)→隐藏层(512)→输出层(2)的全连接网络,使用小批量梯度下降优化,选择适合分类任务的NLL损失函数。经过100轮训练,验证集准确率达81.3%。但该模型存在参数冗余(150万+参数易过拟合)、对图像空间结构不敏感等局限,因此下一篇将引入卷积神经网络解决这些问题。
本文将合集上一篇文章的代码继续盖章。在本文第一节,解释了神经元、神经网络、激活函数以及为什么线性模型+激活函数能够模拟任意函数。接着在第二节,通过torch.nn模块,改造代码,实现了线性模型。接着在第四节,加入激活函数,并构造了一个简单的全链接神经网络,并说明了如何查看神经网络的参数。最后一届,展示了本文的实验结果和完整代码。
学习就是参数估计!本文首先通过人工方法,写出更新参数的具体步骤(第一节)。接着,将人工求导和人工更新参数的地方替换为自动方法(第二、三节)。本文的第四节介绍了分割数据集的必要性,并在第五节提出了分割数据集的具体方法。第六节展示了具体的实验结果和本文的最终代码。
浙公网安备 33010602011771号