摘要: 作为一个 AI 开发者,你一定经历过这样的绝望时刻: 兴致勃勃地下载了最新的 Qwen2-VL 权重,准备用自己的垂直领域数据跑一次 SFT(监督微调)。然而,现实却是残酷的—— RuntimeError: CUDA out of memory —— 显存不够,模型加载失败。 Driver/Libr 阅读全文
posted @ 2025-12-10 14:33 Serverless社区 阅读(121) 评论(0) 推荐(0)