摘要: 本文将在 ACK 容器服务上,以 Bloom7B1 模型为例展示如何使用 FasterTransformer 进行推理加速。 阅读全文
posted @ 2023-08-15 18:10 阿里云云原生 阅读(299) 评论(0) 推荐(0)