摘要:
H100 真的被封印了吗?我用 vLLM+FP8 把吞吐拉爆了 为什么要做这次极限压测? 在原生BF16 精度下,大模型对显存带宽(Memory Bandwidth)和容量的需求呈指数级增长。 高并发场景下,KV Cache 的显存爆炸往往导致Batch Size 无法提升,显卡算力尚未跑满,显存却 阅读全文
posted @ 2025-12-23 14:31
Lab4AI大模型实验室
阅读(28)
评论(0)
推荐(0)
摘要:
实测腾讯混元HY-World 1.5:虚拟世界的推理实战 2025 年 12 月 17 日,腾讯混元发布并开源了 HY-World 1.5(WorldPlay),这款模型不仅是首个开源、实时交互并具备长期几何一致性的世界模型,更标志着 3D 世界生成技术的全新突破。 HY-World 1.5 采 阅读全文
posted @ 2025-12-23 10:23
Lab4AI大模型实验室
阅读(44)
评论(0)
推荐(0)

浙公网安备 33010602011771号