会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
吴建明
微信视频号:sph0RgSyDYV47z6 快手号:4874645212 抖音号:dy0so323fq2w 小红书号:95619019828 B站1:UID:3546863642871878 B站2:UID: 3546955410049087
博客园
首页
新随笔
联系
订阅
管理
2024年1月20日
硬件辅助的NPU多租户,提高资源利用率和公平性
摘要: 硬件辅助的NPU多租户,提高资源利用率和公平性 摘要 现代云平台已经部署了像谷歌云TPU这样的神经处理单元(NPU),以加速在线机器学习(ML)推理服务。为了提高NPU的资源利用率,他们允许多个ML应用程序共享同一个NPU,并开发了时间复用和基于抢占的共享机制。然而,对真实世界的NPU的研究表明,由
阅读全文
posted @ 2024-01-20 05:16 吴建明wujianming
阅读(121)
评论(0)
推荐(0)
公告