北京SGLang Meetup倒计时1天,这场AI Infra深度对话你期待吗?

摘要:会议主题 本次 GPUStack、OpenBMB 和 SGLang 社区联合举办的线下 Meetup,我们将围绕大模型部署中的关键挑战展开分享,重点探讨异构 GPU 管理与推理效率优化等核心痛点,深入解析如何构建面向企业生产环境的统一模型服
会议主题 本次 GPUStack、OpenBMB 和 SGLang 社区联合举办的线下 Meetup,我们将围绕大模型部署中的关键挑战展开分享,重点探讨异构 GPU 管理与推理效率优化等核心痛点,深入解析如何构建面向企业生产环境的统一模型服务平台。 同时,本次 Meetup 还将带来多项前沿实践与进展,包括下一代稀疏注意力的系统设计、SGLang 最新路线图,以及 NVFP4 混合精度量化下的精度与吞吐权衡,共同推动大模型落地与性能优化的持续演进。 欢迎各位伙伴报名参与,期待与你现场交流! 加入 GPUStack 社区 GPUStack 社区聚焦 AI 基础设施与大模型实践。 社区中持续分享真实环境下的部署经验、问题排查案例,以及推理引擎、算力管理和系统架构相关讨论。 欢迎扫码加入 GPUStack 社区,与更多关注 AI Infra 的伙伴交流分享。 若群聊已满或二维码失效,请访问以下页面查看最新群二维码: https://github.com/gpustack/gpustack/blob/main/docs/assets/wechat-group-qrcode.jpg