yolo --- 训练数据集的要求
多样性
1、收集包含不同场景、光照条件、天气条件下的图像,以确保模型具有泛化能力。例如,在自动驾驶场景中,应包含城市道路、高速公路、乡村道路、白天、夜晚、晴天、雨天等多种情况。
2、确保数据集中包含目标物体在不同姿态、角度、遮挡程度下的图像。这有助于模型学习到目标的本质特征,而非仅依赖于特定的视角或遮挡情况。
数量
训练数据集应包含足够数量的图像,以确保模型能够学习到目标的复杂特征。一般来说,数据集越大,模型的性能越好,但也要考虑数据收集和标注的成本。
平衡性
对于多类别目标检测任务,应确保各类别的样本数量相对平衡,避免某些类别样本过多或过少导致的模型偏差。
预处理
将图像调整为模型输入所需的统一尺寸,避免因图像尺寸不一致导致的模型输入错误。

浙公网安备 33010602011771号