当前标签：LLM

从模型推理到开源 AI 基础设施平台：GPUStack v2.1 的关键演进

GPUStack 2026-03-09 14:49 阅读:106 评论:0 推荐:0

vLLM、SGLang 融资背后，AI 推理正在走向系统化与治理

GPUStack 2026-02-03 11:25 阅读:128 评论:0 推荐:0

昇腾多机推理极速上手：10倍简化的 DeepSeek R1 超大规模模型部署

GPUStack 2025-09-27 10:55 阅读:720 评论:1 推荐:0

忘掉Ollama! 将GPT OSS私有部署推理性能提升100倍的部署教程

GPUStack 2025-08-08 17:48 阅读:1897 评论:0 推荐:0

GPUStack v0.6超重磅更新：vLLM多机分布式、昇腾MindIE、模型兼容性检测、模型故障自动恢复，上百项增强打造最好用的模型推理平台

GPUStack 2025-04-28 10:25 阅读:1903 评论:0 推荐:0

GPUStack v0.5：模型Catalog、图生图功能上线，多维优化全面提升产品能力与使用体验

GPUStack 2025-04-28 10:23 阅读:558 评论:0 推荐:0

GPUStack v0.4：文生图模型、语音模型、推理引擎版本管理、离线支持和部署本地模型

GPUStack 2024-12-09 10:20 阅读:3384 评论:0 推荐:0

配置NVIDIA Container Runtime和容器运行GPUStack教程

GPUStack 2024-11-19 10:57 阅读:1116 评论:0 推荐:1

RAG三件套运行的新选择 - GPUStack

GPUStack 2024-11-12 10:02 阅读:7618 评论:0 推荐:0