3.28 北京 Meetup,与 GPUStack、SGLang、MiniCPM 核心成员一起深度对话 AI Infra
会议主题
本次 GPUStack、OpenBMB 和 SGLang 社区联合举办的线下 Meetup,我们将围绕大模型部署中的关键挑战展开分享,重点探讨异构 GPU 管理与推理效率优化等核心痛点,深入解析如何构建面向企业生产环境的统一模型服务平台。
同时,本次 Meetup 还将带来多项前沿实践与进展,包括下一代稀疏注意力的系统设计、SGLang 最新路线图,以及 NVFP4 混合精度量化下的精度与吞吐权衡,共同推动大模型落地与性能优化的持续演进。
欢迎各位伙伴报名参与,期待与你现场交流!

加入 GPUStack 社区
GPUStack 社区聚焦 AI 基础设施与大模型实践。
社区中持续分享真实环境下的部署经验、问题排查案例,以及推理引擎、算力管理和系统架构相关讨论。
欢迎扫码加入 GPUStack 社区,与更多关注 AI Infra 的伙伴交流分享。

若群聊已满或二维码失效,请访问以下页面查看最新群二维码:

浙公网安备 33010602011771号