会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
阿里系统软件技术
博客园
首页
新随笔
联系
订阅
管理
2023年8月
云原生 AI 工程化实践之 FasterTransformer 加速 LLM 推理
摘要: 本文将在 ACK 容器服务上,以 Bloom7B1 模型为例展示如何使用 FasterTransformer 进行推理加速。
阅读全文
posted @ 2023-08-15 18:10 阿里云云原生
阅读(299)
评论(0)
推荐(0)
公告