摘要: 一、前言 PyTorch模型的高性能部署问题,主要关注两个方面:高度优化的算子和高效运行计算图的架构和runtime。python有快速开发以及验证的优点,但是相比C++来说速度较慢而且比较费内存,一般高性能场景都是使用C++去部署,尽量避免使用python环境。 TensorRT为什么那么快,因为 阅读全文
posted @ 2024-01-10 16:19 小金乌会发光-Z&M 阅读(47) 评论(0) 推荐(0) 编辑