模型训练和计算过程中的一些优化
摘要:
优化 I/O 加载 主要是为了减少 CPU-GPU 之间的数据传输瓶颈,提升推理效率。DeepSeek 可能采用了以下几种 极致优化方案: 🔹 1. CPU-GPU 直接访问(Pinned Memory & Zero Copy) ✅ 问题:普通数据传输 • CPU 内存(系统 RAM)和 GPU 阅读全文
posted @ 2025-02-18 17:24 zhangkele 阅读(283) 评论(0) 推荐(0)
浙公网安备 33010602011771号