随笔列表第166页 - 吴建明wujianming

2020年12月15日

摘要： CodeGen概述 CodeGen是在协同开发环境中工作的软件开发人员可以用来生成源代码的工具。该代码可能是Synergy DBL代码，也可能是其他语言的源代码。CodeGen并不局限于为任何特定的开发环境或编程语言生成代码。当然，你不能仅仅使用CodeGen生成任何你能想象得到的源代码。在生成代阅读全文

posted @ 2020-12-15 06:06 吴建明wujianming 阅读(2354) 评论(0) 推荐(1) 编辑

2020年12月14日

算子扫描与递归核

摘要：算子扫描与递归核这是关于如何在TVM中进行循环计算的介绍资料。递归计算是神经网络的一种典型模式。 from __future__ import absolute_import, print_function import tvm import tvm.testing from tvm import 阅读全文

posted @ 2020-12-14 11:00 吴建明wujianming 阅读(124) 评论(0) 推荐(0) 编辑

算子本质与数学函数

摘要：算子本质与数学函数 TVM支持基本的算术运算。在许多情况下，通常需要更复杂的内置函数。例如exp取函数的指数。这些函数依赖于目标系统，可能具有不同目标平台的不同名称。本文将学习如何调用这些特定于目标的函数，以及如何通过tvm的内在API统一接口。 from __future__ import ab 阅读全文

posted @ 2020-12-14 10:37 吴建明wujianming 阅读(475) 评论(0) 推荐(0) 编辑

TVM中的调度原语

摘要： TVM中的调度原语 TVM是一种用于高效内核构造的领域专用语言。本文将展示如何通过TVM提供的，各种原语调度计算。 from __future__ import absolute_import, print_function import tvm from tvm import te import 阅读全文

posted @ 2020-12-14 10:12 吴建明wujianming 阅读(444) 评论(0) 推荐(0) 编辑

NVIDIA GPU的神经网络自动调度

摘要： NVIDIA GPU的神经网络自动调度针对特定设备和工作负载的自动调整对于获得最佳性能至关重要。这是一个关于如何使用自动调度器为NVIDIA GPU调整整个神经网络的资料。为了自动调整一个神经网络，将网络划分成小的子图并独立地进行调整。每个子图被视为一个搜索任务。任务调度器对时间进行切片，并动态阅读全文

posted @ 2020-12-14 09:12 吴建明wujianming 阅读(516) 评论(0) 推荐(0) 编辑

ARM-CPU卷积网络的自动调谐

摘要： ARM-CPU卷积网络的自动调谐为特定的ARM设备自动调谐对于获得最佳性能至关重要。这是一个关于如何调整整个卷积网络的资料。以模板的形式编写了TVM中ARM CPU的操作实现。模板有许多可调旋钮（平铺系数、矢量化、展开等）。将调整神经网络中的所有卷积和深度卷积算子。在调优之后，生成一个日志文件，阅读全文

posted @ 2020-12-14 08:50 吴建明wujianming 阅读(282) 评论(0) 推荐(0) 编辑

x86 cpu卷积网络的自动调谐

摘要： x86 cpu卷积网络的自动调谐这是一个关于如何为x86cpu调整卷积神经网络的文档。本文不会在Windows或最新版本的macOS上运行。要让它运行，需要将主体包装在 if __name__ == "__main__": 块中。 import os import numpy as np imp 阅读全文

posted @ 2020-12-14 08:19 吴建明wujianming 阅读(314) 评论(0) 推荐(0) 编辑

NVIDIA GPU卷积网络的自动调谐

摘要： NVIDIA GPU卷积网络的自动调谐针对特定设备和工作负载的自动调整对于获得最佳性能至关重要。这是关于如何为NVIDIA GPU调整整个卷积网络。 NVIDIA GPU在TVM中的操作实现是以模板形式编写的。模板有许多可调旋钮（平铺系数、展开等）。将调整神经网络中的所有卷积和深度卷积算子。在调优阅读全文

posted @ 2020-12-14 08:03 吴建明wujianming 阅读(533) 评论(0) 推荐(0) 编辑

编写可调模板并使用Auto-tuner自动调谐器

摘要：编写可调模板并使用Auto-tuner自动调谐器本文介绍在TVM自动调谐模块。自动调谐有两个步骤。第一步是定义搜索空间。第二步是运行一个搜索算法来探索这个空间。可以学习如何在TVM中执行这两个步骤。以矩阵乘法为例说明了整个工作流程。本文不会在Windows或最新版本的macOS上运行。要让它运阅读全文

posted @ 2020-12-14 07:09 吴建明wujianming 阅读(373) 评论(0) 推荐(0) 编辑

用Auto-TensorCore代码生成优化matmul

摘要：用Auto-TensorCore代码生成优化matmul 将演示如何使用TVM Auto TensorCore CodeGen在Volta/Turing GPU上编写高性能matmul调度。这是一个透明的解决方案，可以生成大多数在ir过程中完成的转换的tensorcore内核。用户还可以编写带有te 阅读全文

posted @ 2020-12-14 06:36 吴建明wujianming 阅读(164) 评论(0) 推荐(0) 编辑

吴建明

公告