• 博客园logo
  • 会员
  • 周边
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • YouClaw
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
返回主页

gpustack

  • 博客园
  • 首页
  • 新随笔
  • 联系
  • 订阅
  • 管理

当前标签:vLLM

vLLM 新参数 performance-mode 能带来多大提升?Qwen3.5 实测告诉你答案
GPUStack 2026-04-08 14:15 阅读:51 评论:0 推荐:0
挑战 Qwen 3.5:Gemma 4 私有部署与文本、图像、视频、音频处理及思考模式、工具调用全教程
GPUStack 2026-04-07 10:24 阅读:489 评论:0 推荐:0
vLLM Ascend 是最优解吗?基于 mis-tei 实现昇腾上的高性能 Embedding/Reranker 模型推理
GPUStack 2026-04-01 09:58 阅读:49 评论:0 推荐:0
倒计时 1 天!北京 SGLang Meetup,一场关于 AI Infra 的深度对话
GPUStack 2026-03-27 11:18 阅读:13 评论:0 推荐:0
阿里 PPU 加入 GPUStack 国产算力版图:异构算力统一调度的重磅里程碑
GPUStack 2026-03-17 14:13 阅读:83 评论:0 推荐:0
vLLM、SGLang 融资背后,AI 推理正在走向系统化与治理
GPUStack 2026-02-03 11:25 阅读:138 评论:0 推荐:0
GPUStack v2:推理加速释放算力潜能,开源重塑大模型推理下半场
GPUStack 2025-11-25 17:35 阅读:1452 评论:0 推荐:0
忘掉Ollama! 将GPT OSS私有部署推理性能提升100倍的部署教程
GPUStack 2025-08-08 17:48 阅读:1925 评论:0 推荐:0

公告

博客园  ©  2004-2026
浙公网安备 33010602011771号 浙ICP备2021040463号-3