上一页 1 ··· 267 268 269 270 271 272 273 274 275 ··· 367 下一页
摘要: 扩展LLVM:添加指令、内部函数、类型等 Introduction and Warning Adding a new intrinsic function Adding a new instruction Adding a new SelectionDAG node Adding a new typ 阅读全文
posted @ 2020-12-25 14:23 吴建明wujianming 阅读(1495) 评论(0) 推荐(0)
摘要: cuGraph-GPU图形分析 所述RAPIDS cuGraph库是GPU的集合加速图形算法,在GPU DataFrames中发现过程数据。cuGraph的愿景是使图分析无处不在,以至于用户只是根据分析而不是技术或框架来思考。为了实现这一构想,cuGraph操作时,在Python的层,在GPU上Da 阅读全文
posted @ 2020-12-25 09:21 吴建明wujianming 阅读(427) 评论(0) 推荐(0)
摘要: nvGRAPH API参考分析(二) nvGRAPH Code Examples 本文提供了简单的示例。 1. nvGRAPH convert topology example void check(nvgraphStatus_t status) { if (status != NVGRAPH_ST 阅读全文
posted @ 2020-12-25 08:45 吴建明wujianming 阅读(132) 评论(0) 推荐(0)
摘要: nvGRAPH API参考分析(一) 本文通过描述nvGRAPH库函数的输入/输出参数,数据类型和错误代码来指定其行为。 1. 返回值nvgraphStatus_t 除以下内容外,所有nvGRAPH库返回值 NVGRAPH_STATUS_SUCCESS表示当前的API调用失败,用户应重新配置以更正该 阅读全文
posted @ 2020-12-25 08:34 吴建明wujianming 阅读(136) 评论(0) 推荐(0)
摘要: nvGRAPH原理概述 nvGRAPH的API参考分析。 简介 数据分析是高性能计算的不断增长的应用。许多高级数据分析问题可以称为图形问题。反过来,当今许多常见的图形问题也可以称为稀疏线性代数。这是NVIDIA®CUDA™8.0中新增的nvGRAPH的动机,该功能利用GPU的线性代数功能来处理最大的 阅读全文
posted @ 2020-12-25 07:21 吴建明wujianming 阅读(293) 评论(0) 推荐(0)
摘要: 代码生成codegen 该模块提供了从SymPy表达式生成直接可编译代码的功能。该codegen功能是SymPy中代码生成功能的用户界面。下面为可能希望直接使用框架的高级用户提供了一些实现细节。 注意 该codegen调用是不是自动在sympy命名空间,必须首先执行才能使用 Run code blo 阅读全文
posted @ 2020-12-25 07:09 吴建明wujianming 阅读(472) 评论(0) 推荐(0)
摘要: 使用Tensorize评估硬件内部特性 这是有关如何在TVM中执行张量的入门文档。 通过使用调度原语tensorize,人们可以用相应的内部函数代替计算单元,从而轻松利用handcrafted micro-kernels,扩展TVM以支持新的硬件体系结构。 本文的目的是展示张量的功能和用法,而不是提 阅读全文
posted @ 2020-12-24 21:07 吴建明wujianming 阅读(217) 评论(0) 推荐(0)
摘要: 使用元组输入进行计算和归约 在一个循环中计算出具有相同形状的多个输出,或者执行涉及多个值的归约,例如 argmax。这些问题可以通过元组输入解决。 本文将介绍TVM中元组输入的用法。 from __future__ import absolute_import, print_function imp 阅读全文
posted @ 2020-12-24 20:27 吴建明wujianming 阅读(182) 评论(0) 推荐(0)
摘要: 自动调试用于移动GPU的卷积网络 对特定设备进行自动调试对于获得最佳性能至关重要。这是有关如何调试整个卷积网络的说明文档。 TVM中Mobile GPU的算子实现以模板形式编写。模板具有许多可调旋钮(平铺因子,矢量化,展开等)。将调试神经网络中的所有卷积,深度卷积和密集算子。调试后,生成一个日志文件 阅读全文
posted @ 2020-12-24 20:07 吴建明wujianming 阅读(268) 评论(0) 推荐(0)
摘要: 编写可调模板并使用自动调谐器 这是TVM中自动调试模块的入门说明。 自动调试有两个步骤。第一步是定义搜索空间。第二步是运行搜索算法来探索这个空间。本文可以学习如何在TVM中执行这两个步骤。整个工作流程由矩阵乘法示例说明。 注意,本文无法在Windows或最新版本的macOS上运行。要使其运行,需要将 阅读全文
posted @ 2020-12-24 07:55 吴建明wujianming 阅读(115) 评论(0) 推荐(0)
上一页 1 ··· 267 268 269 270 271 272 273 274 275 ··· 367 下一页