摘要: 本文介绍了如何借助 llmaz 快速部署基于 vLLM 的大语言模型推理服务,并结合 Higress AI 网关 实现服务代理、流量调度、可观测性和 Fallback 等关键能力。 阅读全文
posted @ 2025-06-30 13:54 阿里云云原生 阅读(164) 评论(0) 推荐(0)
摘要: 2025 年 4 月阿里百炼发布 MCP SSE 模式直击我司痛点,即刻选择全面拥抱,升级公司 AI 架构。把公司内部 30+ 数字化系统能力结合 AI 全面增强。 阅读全文
posted @ 2025-06-30 13:22 阿里云云原生 阅读(144) 评论(0) 推荐(0)
摘要: Nacos 与 Dify 的结合,为生成式 AI 应用的开发效率与架构灵活性提供了新的解决方案。 阅读全文
posted @ 2025-06-30 12:03 阿里云云原生 阅读(344) 评论(0) 推荐(0)