11 2023 档案

摘要:Polygraphy 目录Polygraphy工具说明依赖&安装功能&Toolsrunloggingrunnermodelonnxtensorrtdata loadercomparator使用示例convertdebuginspectsurgeonruncomparison metricsgener 阅读全文
posted @ 2023-11-10 20:46 xle97 阅读(2130) 评论(1) 推荐(1)
摘要:前言 模型量化是一种流行的深度学习优化方法,它将模型数据(包括网络参数和激活)从浮点表示转换为低精度表示,通常使用 8 位整数。这样做有几个好处: 在处理 8 位整数数据时,GPU(如英伟达)采用速度更快、成本更低的 8 位张量核心来计算卷积和矩阵乘法运算。这将产生更多的计算吞吐量,对计算受限的层尤 阅读全文
posted @ 2023-11-02 14:50 xle97 阅读(361) 评论(0) 推荐(0)