3.28 北京 Meetup,与 GPUStack、SGLang、MiniCPM 核心成员一起深度对话 AI Infra

会议主题

本次 GPUStack、OpenBMB 和 SGLang 社区联合举办的线下 Meetup,我们将围绕大模型部署中的关键挑战展开分享,重点探讨异构 GPU 管理推理效率优化等核心痛点,深入解析如何构建面向企业生产环境的统一模型服务平台

同时,本次 Meetup 还将带来多项前沿实践与进展,包括下一代稀疏注意力的系统设计SGLang 最新路线图,以及 NVFP4 混合精度量化下的精度与吞吐权衡,共同推动大模型落地与性能优化的持续演进。

欢迎各位伙伴报名参与,期待与你现场交流!

海报

加入 GPUStack 社区

GPUStack 社区聚焦 AI 基础设施与大模型实践

社区中持续分享真实环境下的部署经验、问题排查案例,以及推理引擎、算力管理和系统架构相关讨论。

欢迎扫码加入 GPUStack 社区,与更多关注 AI Infra 的伙伴交流分享。

二维码

若群聊已满或二维码失效,请访问以下页面查看最新群二维码:

posted @ 2026-03-20 15:09  GPUStack  阅读(2)  评论(0)    收藏  举报