摘要:
打造业界最好用的模型推理平台。 阅读全文
打造业界最好用的模型推理平台。 阅读全文
posted @ 2025-04-28 10:25
GPUStack
阅读(1744)
评论(0)
推荐(0)
摘要:
开箱即用的模型推理体验。 阅读全文
开箱即用的模型推理体验。 阅读全文
posted @ 2025-04-28 10:23
GPUStack
阅读(538)
评论(0)
推荐(0)

千呼万唤,GPUStack 迄今最受用户关注、超多新功能的版本重磅发布!
配置 NVIDIA 容器运行时环境并使用容器方式运行 GPUStack 的操作教程
安装 GPUStack 和 Dify,并使用 Dify 来对接 GPUStack 部署的对话模型、Embedding 模型和 Reranker 模型。
使用 llama.cpp 制作并量化 GGUF 模型,并将模型上传到 HuggingFace 和 ModelScope 模型仓库
使用 GPUStack 在昇腾 Ascend 910B 上运行 Qwen2.5 全系列的推理性能表现
单机多卡分布式推理、跨主机分布式推理、CPU 推理、各种调度策略,你想要的全都有
GPUStack 正式发布并开源,一个用于运行 LLM(大型语言模型)的开源 GPU 集群管理器。
浙公网安备 33010602011771号