摘要: H100 真的被封印了吗?我用 vLLM+FP8 把吞吐拉爆了 为什么要做这次极限压测? 在原生BF16 精度下,大模型对显存带宽(Memory Bandwidth)和容量的需求呈指数级增长。 高并发场景下,KV Cache 的显存爆炸往往导致Batch Size 无法提升,显卡算力尚未跑满,显存却 阅读全文
posted @ 2025-12-23 14:31 Lab4AI大模型实验室 阅读(28) 评论(0) 推荐(0)
摘要: 实测腾讯混元HY-World 1.5:虚拟世界的推理实战 ​ 2025 年 12 月 17 日,腾讯混元发布并开源了 HY-World 1.5(WorldPlay),这款模型不仅是首个开源、实时交互并具备长期几何一致性的世界模型,更标志着 3D 世界生成技术的全新突破。 HY-World 1.5 采 阅读全文
posted @ 2025-12-23 10:23 Lab4AI大模型实验室 阅读(44) 评论(0) 推荐(0)