摘要: Triton Inference Server 定位 在接触了一段时间的 Triton 之后,我认为它的定位在于模型服务,即它的主要职责和服务紧密相关,服务中常见的需求它需要做处理。比如 Batching,Sequence,Pipeline 等,再比如模型仓库的管理,模型后端引擎的管理等,还有性能测 阅读全文
posted @ 2021-10-30 21:17 楷哥 阅读(5246) 评论(3) 推荐(1)