会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
gpustack
博客园
首页
新随笔
联系
订阅
管理
当前标签:vLLM
vLLM 新参数 performance-mode 能带来多大提升?Qwen3.5 实测告诉你答案
GPUStack 2026-04-08 14:15
阅读:51
评论:0
推荐:0
挑战 Qwen 3.5:Gemma 4 私有部署与文本、图像、视频、音频处理及思考模式、工具调用全教程
GPUStack 2026-04-07 10:24
阅读:489
评论:0
推荐:0
vLLM Ascend 是最优解吗?基于 mis-tei 实现昇腾上的高性能 Embedding/Reranker 模型推理
GPUStack 2026-04-01 09:58
阅读:49
评论:0
推荐:0
倒计时 1 天!北京 SGLang Meetup,一场关于 AI Infra 的深度对话
GPUStack 2026-03-27 11:18
阅读:13
评论:0
推荐:0
阿里 PPU 加入 GPUStack 国产算力版图:异构算力统一调度的重磅里程碑
GPUStack 2026-03-17 14:13
阅读:83
评论:0
推荐:0
vLLM、SGLang 融资背后,AI 推理正在走向系统化与治理
GPUStack 2026-02-03 11:25
阅读:138
评论:0
推荐:0
GPUStack v2:推理加速释放算力潜能,开源重塑大模型推理下半场
GPUStack 2025-11-25 17:35
阅读:1452
评论:0
推荐:0
忘掉Ollama! 将GPT OSS私有部署推理性能提升100倍的部署教程
GPUStack 2025-08-08 17:48
阅读:1925
评论:0
推荐:0
公告