会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
gpustack
博客园
首页
新随笔
联系
订阅
管理
当前标签:LLM
昇腾多机推理极速上手:10倍简化的 DeepSeek R1 超大规模模型部署
GPUStack 2025-09-27 10:55
阅读:635
评论:1
推荐:0
忘掉Ollama! 将GPT OSS私有部署推理性能提升100倍的部署教程
GPUStack 2025-08-08 17:48
阅读:1711
评论:0
推荐:0
GPUStack v0.6超重磅更新:vLLM多机分布式、昇腾MindIE、模型兼容性检测、模型故障自动恢复,上百项增强打造最好用的模型推理平台
GPUStack 2025-04-28 10:25
阅读:1724
评论:0
推荐:0
GPUStack v0.5:模型Catalog、图生图功能上线,多维优化全面提升产品能力与使用体验
GPUStack 2025-04-28 10:23
阅读:536
评论:0
推荐:0
GPUStack v0.4:文生图模型、语音模型、推理引擎版本管理、离线支持和部署本地模型
GPUStack 2024-12-09 10:20
阅读:3269
评论:0
推荐:0
配置NVIDIA Container Runtime和容器运行GPUStack教程
GPUStack 2024-11-19 10:57
阅读:1043
评论:0
推荐:1
RAG三件套运行的新选择 - GPUStack
GPUStack 2024-11-12 10:02
阅读:7422
评论:0
推荐:0
公告