深度学习科研代码和实验管理&看懂开源项目每个文件&解决常见的代码报错&选择适合自己的方向
科研代码和实验管理
【深度学习科研中,如何高效进行代码和实验管理?——神经网络/机器学习/pytorch】 https://www.bilibili.com/video/BV1NRijB7E8J/?share_source=copy_web&vd_source=e9d67ecc6775d595879efd0a7d60d332
高效进行实验和代码管理
环境要独立
代码要版本化,代码不要写死
数据也要版本化
实验结果要会说话
环境管理推荐用 uv

看懂开源项目每个文件
【深度学习初学者怎么看懂开源项目每个文件的意思?如何构建自己的数据集?-神经网络/pytorch】 https://www.bilibili.com/video/BV1S8nEzMEta/?share_source=copy_web&vd_source=e9d67ecc6775d595879efd0a7d60d332


解决常见的代码报错
【B站独家!手把手带你解决深度学习中所有常见的代码报错问题!!!-pytorch/神经网络/卷积神经网络】 https://www.bilibili.com/video/BV12EaUzjEyH/?share_source=copy_web&vd_source=e9d67ecc6775d595879efd0a7d60d332
01 ModuleNotFoundError
ModuleNotFoundError / ImportError
模块未安装、环境路径不对、版本冲突

pytorch.org
pytorch.org/get-started/previous-versions/
选合适的版本
02 OSError
OSError: [Errno ...] / DLL load failed
多为库版本不兼容(比如torch与 CUDA版本不匹配)

03 OMP: Error #15 / OpenMP runtime error
OMP: Error #15 / OpenMP
runtime error原因:多线程运行时加载了多个libiomp5md.dll

04 RuntimeError
RuntimeError: shape '..' is invalid for input of size
reshape/view的目标形状与元素数量不匹配。
RuntimeError: Expected input of size ... but got ...
输入维度与模型期望维度不一致(如Conv2D要求[N,C,H,W],但传入[N,H,W,C]
RuntimeError: CUDA out of memory
显存不足。
RuntimeError: CUDA error: device-side assert triggered
label超出类别范围。
05 AssertionError: Torch not compiled with CUDA enabled
AssertiorError: Torch not compiled with CUDA enabled
装的是 CPU 版本的 PyTorch。
06 ValueError
ValueError: Target size (torch.Size([...])) must be the same as input size (torch.Size([...]))
Loss 函数要求输入和标签 shape 对齐。
ValueError: too many values to unpack (expected 2)
数据加载时返回的元组数与解包变量数不一致。
07 FileNotFoundError
FileNotFoundError
路径错误。

08 UnicodeDecodeError
UnicodeDecodeError
读取文本编码错误。

选择适合自己的方向
【【方向选错论文无望】15分钟告诉你,深度学习研究生应该如何选择适合自己的方向!】 https://www.bilibili.com/video/BV1Sw88ztEpy/?share_source=copy_web&vd_source=e9d67ecc6775d595879efd0a7d60d332
CNN 图像相关, 入门简单,深入复杂,极度内卷
RNN 时序相关,入门复杂,深入简单,大模型入门
GAN 生成对抗相关,入门简单,及其有用,大模型高度相关
GNN 图结构相关,入门极难,深入复杂,一片蓝海

浙公网安备 33010602011771号