作者:周琦、李润泽、张钧瑞
我们团队接到了一个极具挑战的任务:利用无人机视角训练一个目标检测模型,用于应急救援场景,初期需要精准识别行人和车辆。作为项目的基础,第一周的主要任务是在周琦的带领下,从零开始搭建深度学习训练环境。
硬件选型与系统配置
我们选用了搭载 NVIDIA GeForce RTX 4060 Laptop GPU (8GB 显存) 的笔记本作为主力训练机。李润泽负责检查了CUDA驱动环境,确保 PyTorch 能够正常调用显卡资源。
环境搭建踩坑
张钧瑞负责具体执行环境的搭建。我们首先安装了 Anaconda,随后创建了独立的 Python 虚拟环境。在这个阶段,我们经历了“Python版本不匹配”、“pip源下载过慢”、“编码格式报错”等一系列新手必踩的坑。特别是 visdrone2yolo.py 脚本因为路径错误反复修改,最终通过不断的排查和修正,终于让 YOLO 框架在本地成功跑通。
成果与规划
经过一周的努力,我们成功在本地跑通了YOLO的训练流。下一阶段,我们将正式引入 VisDrone 无人机数据集,进行初步的模型训练。
浙公网安备 33010602011771号