会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
aibi1
博客园
首页
新随笔
联系
订阅
管理
Ray 调度框架的作用
目录
2️⃣ Ray 的作用
2️⃣ Ray 的作用
Ray / 分布式调度主要用于:
多节点 / 多模型请求调度
自动把请求分配到最空闲的 worker
处理大规模并发请求(千 QPS 级别)
多模型/异构 GPU 调度
同时部署小模型 + 大模型,或者不同上下文规格模型
自动路由请求到合适 GPU
弹性伸缩
动态增加/减少 worker 节点
适合云端大规模部署
posted @
2026-01-19 16:12
向着朝阳
阅读(
0
) 评论(
0
)
收藏
举报
刷新页面
返回顶部
公告