摘要: 使用Tensorize评估硬件内部特性 这是有关如何在TVM中执行张量的入门文档。 通过使用调度原语tensorize,人们可以用相应的内部函数代替计算单元,从而轻松利用handcrafted micro-kernels,扩展TVM以支持新的硬件体系结构。 本文的目的是展示张量的功能和用法,而不是提 阅读全文
posted @ 2020-12-24 21:07 吴建明wujianming 阅读(217) 评论(0) 推荐(0)
摘要: 使用元组输入进行计算和归约 在一个循环中计算出具有相同形状的多个输出,或者执行涉及多个值的归约,例如 argmax。这些问题可以通过元组输入解决。 本文将介绍TVM中元组输入的用法。 from __future__ import absolute_import, print_function imp 阅读全文
posted @ 2020-12-24 20:27 吴建明wujianming 阅读(182) 评论(0) 推荐(0)
摘要: 自动调试用于移动GPU的卷积网络 对特定设备进行自动调试对于获得最佳性能至关重要。这是有关如何调试整个卷积网络的说明文档。 TVM中Mobile GPU的算子实现以模板形式编写。模板具有许多可调旋钮(平铺因子,矢量化,展开等)。将调试神经网络中的所有卷积,深度卷积和密集算子。调试后,生成一个日志文件 阅读全文
posted @ 2020-12-24 20:07 吴建明wujianming 阅读(268) 评论(0) 推荐(0)
摘要: 编写可调模板并使用自动调谐器 这是TVM中自动调试模块的入门说明。 自动调试有两个步骤。第一步是定义搜索空间。第二步是运行搜索算法来探索这个空间。本文可以学习如何在TVM中执行这两个步骤。整个工作流程由矩阵乘法示例说明。 注意,本文无法在Windows或最新版本的macOS上运行。要使其运行,需要将 阅读全文
posted @ 2020-12-24 07:55 吴建明wujianming 阅读(115) 评论(0) 推荐(0)
摘要: NVIDIA GPU自动调度神经网络 对特定设备和工作负载进行自动调试对于获得最佳性能至关重要。这是有关如何使用自动调度器为NVIDIA GPU调试整个神经网络的说明文档。 为了自动调试神经网络,将网络划分为小的子图,并对其进行独立调试。每个子图被视为一个搜索任务。任务调度程序可以对时间进行分片,并 阅读全文
posted @ 2020-12-24 07:32 吴建明wujianming 阅读(312) 评论(0) 推荐(0)
摘要: CPU的自动调度矩阵乘法 这是一个有关如何对CPU使用自动调度程序的文档。 与依靠手动模板定义搜索空间的基于模板的autotvm不同,自动调度程序不需要任何模板。用户只需要编写计算声明,而无需任何调度命令或模板。自动调度程序可以自动生成较大的搜索空间,并在该空间中找到良好的调度。 本文以矩阵乘法为例 阅读全文
posted @ 2020-12-24 07:03 吴建明wujianming 阅读(340) 评论(0) 推荐(0)
摘要: 自动调度GPU的卷积层 这是有关如何对GPU使用自动调度程序的文档。 与依靠手动模板定义搜索空间的基于模板的autotvm不同,自动调度程序不需要任何模板。用户只需要编写计算声明,而无需任何调度命令或模板。自动调度程序可以自动生成较大的搜索空间,并在该空间中找到良好的调度。 本文以卷积层为例。 注意 阅读全文
posted @ 2020-12-24 06:35 吴建明wujianming 阅读(102) 评论(0) 推荐(0)
摘要: 为x86 CPU自动调度神经网络 对特定设备和工作负载进行自动调试对于获得最佳性能至关重要。这是有关如何使用自动调度器为x86 CPU调试整个神经网络的文档。 为了自动调试神经网络,将网络划分为小的子图,并对其进行独立调试。每个子图被视为一个搜索任务。任务调度程序可以对时间进行分片,并为这些任务动态 阅读全文
posted @ 2020-12-24 06:16 吴建明wujianming 阅读(211) 评论(0) 推荐(0)