3.28 北京 Meetup，与 GPUStack、SGLang、MiniCPM 核心成员一起深度对话 AI Infra

会议主题

本次 GPUStack、OpenBMB 和 SGLang 社区联合举办的线下 Meetup，我们将围绕大模型部署中的关键挑战展开分享，重点探讨异构 GPU 管理与推理效率优化等核心痛点，深入解析如何构建面向企业生产环境的统一模型服务平台。

同时，本次 Meetup 还将带来多项前沿实践与进展，包括下一代稀疏注意力的系统设计、SGLang 最新路线图，以及 NVFP4 混合精度量化下的精度与吞吐权衡，共同推动大模型落地与性能优化的持续演进。

欢迎各位伙伴报名参与，期待与你现场交流！

GPUStack 社区聚焦 AI 基础设施与大模型实践。

社区中持续分享真实环境下的部署经验、问题排查案例，以及推理引擎、算力管理和系统架构相关讨论。

欢迎扫码加入 GPUStack 社区，与更多关注 AI Infra 的伙伴交流分享。

若群聊已满或二维码失效，请访问以下页面查看最新群二维码：

posted @ 2026-03-20 15:09 GPUStack 阅读(21) 评论(0) 收藏举报

刷新页面返回顶部