• 博客园logo
  • 会员
  • 周边
  • 新闻
  • 博问
  • 闪存
  • 众包
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
返回主页

gpustack

  • 博客园
  • 首页
  • 新随笔
  • 联系
  • 订阅
  • 管理

当前标签:LLM

昇腾多机推理极速上手:10倍简化的 DeepSeek R1 超大规模模型部署
GPUStack 2025-09-27 10:55 阅读:635 评论:1 推荐:0
忘掉Ollama! 将GPT OSS私有部署推理性能提升100倍的部署教程
GPUStack 2025-08-08 17:48 阅读:1711 评论:0 推荐:0
GPUStack v0.6超重磅更新:vLLM多机分布式、昇腾MindIE、模型兼容性检测、模型故障自动恢复,上百项增强打造最好用的模型推理平台
GPUStack 2025-04-28 10:25 阅读:1724 评论:0 推荐:0
GPUStack v0.5:模型Catalog、图生图功能上线,多维优化全面提升产品能力与使用体验
GPUStack 2025-04-28 10:23 阅读:536 评论:0 推荐:0
GPUStack v0.4:文生图模型、语音模型、推理引擎版本管理、离线支持和部署本地模型
GPUStack 2024-12-09 10:20 阅读:3269 评论:0 推荐:0
配置NVIDIA Container Runtime和容器运行GPUStack教程
GPUStack 2024-11-19 10:57 阅读:1043 评论:0 推荐:1
RAG三件套运行的新选择 - GPUStack
GPUStack 2024-11-12 10:02 阅读:7422 评论:0 推荐:0

公告

博客园  ©  2004-2026
浙公网安备 33010602011771号 浙ICP备2021040463号-3