上一页 1 ··· 193 194 195 196 197 198 199 200 201 ··· 367 下一页
摘要: Tensorrt一些优化技术介绍 Figure 1. A quantizable AveragePool layer (in blue) is fused with a DQ layer and a Q layer. All three layers are replaced by a quanti 阅读全文
posted @ 2021-12-13 05:48 吴建明wujianming 阅读(189) 评论(0) 推荐(0)
摘要: LLVM与Clang编译图例 参考链接: https://blog.csdn.net/u012874859/article/details/108530256 阅读全文
posted @ 2021-12-12 06:24 吴建明wujianming 阅读(55) 评论(0) 推荐(0)
摘要: OpenCL产业开发链 OPEN STANDARD FOR PARALLEL PROGRAMMING OF HETEROGENEOUS SYSTEMS OpenCL™ (Open Computing Language,开放计算语言)是一种开放、免版税的标准,适用于超级计算机、云服务器、个人计算机、移 阅读全文
posted @ 2021-12-11 06:31 吴建明wujianming 阅读(197) 评论(0) 推荐(0)
摘要: OpenCL框架与示例下面的图简单说明了OpenCL的编程框架,图是用的GPU,其他类似; 名词的概念: Platform (平台):主机加上OpenCL框架管理下的若干设备构成了这个平台,通过这个平台,应用程序可以与设备共享资源并在设备上执行kernel。实际使用中基本上一个厂商对应一个Platf 阅读全文
posted @ 2021-12-10 06:17 吴建明wujianming 阅读(525) 评论(0) 推荐(0)
摘要: pass基础架构分析 Relay 和 TVM IR,包含一系列优化passes,可提高模型的性能指标,如平均推理,内存占用,或特定设备的功耗。有一套标准优化,及特定机器学习的优化,包括常量折叠,死代码消除,算子布局更改,算子融合,缓冲区处理和循环转换等。这些passes中的每一个,构造为一个 ir- 阅读全文
posted @ 2021-12-09 06:21 吴建明wujianming 阅读(891) 评论(0) 推荐(0)
摘要: TensorFlow XLA优化与Memory XLA概述 XLA(加速线性代数)是用于优化TensorFlow计算的线性代数的域特定编译器。结果是在服务器与移动平台上的速度,内存使用率与可移植性得到了改善。最初,大多数用户不会从XLA中看到很大的好处,通过使用即时(JIT)编译或提前编译(AOT) 阅读全文
posted @ 2021-12-08 05:56 吴建明wujianming 阅读(383) 评论(0) 推荐(0)
摘要: CUDA编程图例 CUDA C++ Programming Guide Figure 7. Matrix Multiplication without Shared Memory Figure 8. Matrix Multiplication with Shared Memory Figure 20 阅读全文
posted @ 2021-12-07 06:12 吴建明wujianming 阅读(81) 评论(0) 推荐(0)
摘要: 写算子单元测试Writing Unit Tests! 一些单元测试示例,可在tests/python/relay/test_op_level3.py中找到,用于累积总和与乘积算子。 梯度算子 梯度算子对于编写Relay中的可微程序非常重要。虽然Relay的autodiff算法可区分一流的语言结构,但 阅读全文
posted @ 2021-12-06 05:45 吴建明wujianming 阅读(148) 评论(0) 推荐(0)
摘要: ADAS产业链分析自动驾驶汽车(AutonomousVehicles,AV)指通过搭载先进传感器等装置,运用人工智能、视觉计算、雷达和全球定位及车路协同等技术,使汽车具有环境感知、路径规划和自主控制的能力,从而可让计算机自动操作的机动车辆。自动驾驶车辆最大特点是人工智能技术的主导,其驾驶过程是机器不 阅读全文
posted @ 2021-12-05 06:35 吴建明wujianming 阅读(1814) 评论(0) 推荐(0)
摘要: ONNX MLIR应用示例(含源码链接) 开放式神经网络交换在MLIR中的实现 (http://onnx.ai/onnx-mlir/)。 Prebuilt Containers 开始使用ONNX-MLIR的一个简单方法是使用预构建的docker映像。这些映像是在主干上成功合并生成的结果。最新的图像代 阅读全文
posted @ 2021-12-04 06:44 吴建明wujianming 阅读(971) 评论(0) 推荐(0)
上一页 1 ··· 193 194 195 196 197 198 199 200 201 ··· 367 下一页