摘要: Auto-Tuning 原理 9.8.1英伟达GPU卷积网络的自动调谐 针对特定设备和工作负载的自动调谐对于获得最佳性能至关重要。本节描述如何为英伟达GPU调谐整个卷积网络。 TVM 中英伟达GPU 的运算符实现是以模板形式编写的。该模板有许多可调旋钮(平铺系数、展开等)。将调谐所有卷积和深度卷积运 阅读全文
posted @ 2024-04-25 03:40 吴建明wujianming 阅读(249) 评论(0) 推荐(0)