摘要: pytorch深度学习实战:自定义数据集类型 本章围绕医学影像数据加载展开,核心是将 LUNA16 数据集的 CT 扫描文件(.mhd/.raw)与 CSV 标注文件转换为 PyTorch 可用的训练样本。首先合并并匹配候选结节标注信息,通过 Ct 类加载 CT 数据并裁剪 HU 值至合理范围,完成病人坐标系(XYZ)与数组坐标系(IRC)的转换;接着自定义 LunaDataset 类实现数据集核心方法,采用内存 + 磁盘缓存策略优化性能,按步长采样划分训练 / 验证集;最终输出包含候选区域张量、分类标签等的标准化训练样本,形成完整的数据准备流水线。 阅读全文
posted @ 2026-01-22 22:14 榴红八色鸫 阅读(5) 评论(0) 推荐(0)