摘要: GPUStack v0.6超重磅更新:vLLM多机分布式、昇腾MindIE、模型兼容性检测、模型故障自动恢复,上百项增强打造最好用的模型推理平台 打造业界最好用的模型推理平台。 阅读全文
posted @ 2025-04-28 10:25 GPUStack 阅读(1744) 评论(0) 推荐(0)
摘要: GPUStack v0.5:模型Catalog、图生图功能上线,多维优化全面提升产品能力与使用体验 开箱即用的模型推理体验。 阅读全文
posted @ 2025-04-28 10:23 GPUStack 阅读(538) 评论(0) 推荐(0)
摘要: GPUStack v0.4:文生图模型、语音模型、推理引擎版本管理、离线支持和部署本地模型 千呼万唤,GPUStack 迄今最受用户关注、超多新功能的版本重磅发布! 阅读全文
posted @ 2024-12-09 10:20 GPUStack 阅读(3283) 评论(0) 推荐(0)
摘要: 配置NVIDIA Container Runtime和容器运行GPUStack教程 配置 NVIDIA 容器运行时环境并使用容器方式运行 GPUStack 的操作教程 阅读全文
posted @ 2024-11-19 10:57 GPUStack 阅读(1048) 评论(0) 推荐(1)
摘要: RAG三件套运行的新选择 - GPUStack 安装 GPUStack 和 Dify,并使用 Dify 来对接 GPUStack 部署的对话模型、Embedding 模型和 Reranker 模型。 阅读全文
posted @ 2024-11-12 10:02 GPUStack 阅读(7444) 评论(0) 推荐(0)
摘要: 制作并量化GGUF模型上传到HuggingFace和ModelScope 使用 llama.cpp 制作并量化 GGUF 模型,并将模型上传到 HuggingFace 和 ModelScope 模型仓库 阅读全文
posted @ 2024-11-07 11:51 GPUStack 阅读(1110) 评论(0) 推荐(0)
摘要: 在昇腾Ascend 910B上运行Qwen2.5推理 使用 GPUStack 在昇腾 Ascend 910B 上运行 Qwen2.5 全系列的推理性能表现 阅读全文
posted @ 2024-11-04 09:57 GPUStack 阅读(5398) 评论(0) 推荐(0)
摘要: GPUStack 0.2:开箱即用的分布式推理、CPU推理和调度策略 单机多卡分布式推理、跨主机分布式推理、CPU 推理、各种调度策略,你想要的全都有 阅读全文
posted @ 2024-09-19 10:07 GPUStack 阅读(1488) 评论(0) 推荐(0)
摘要: GPUStack正式发布: 为大模型而生的开源GPU集群管理器 GPUStack 正式发布并开源,一个用于运行 LLM(大型语言模型)的开源 GPU 集群管理器。 阅读全文
posted @ 2024-07-26 16:15 GPUStack 阅读(7497) 评论(0) 推荐(0)