上一页 1 ··· 307 308 309 310 311 312 313 314 315 ··· 400 下一页
摘要: 点云建模场景分析 新技术一直在扰乱建筑和土木工程行业。点云建模已经存在了一段时间,但它已成为承包商和工程师的主要工具,在进行土地调查时寻求更多的便捷性和效率。用更少的资源来完成相同的工作-这是每个人从其业务努力中想要的。但是,点云到底是什么?它对测量工作场所有何帮助? 本文介绍如何将点云用于3D模型 阅读全文
posted @ 2020-12-11 20:04 吴建明wujianming 阅读(1037) 评论(0) 推荐(0)
摘要: 激光雷达基础-光探测和测距-遥感 激光雷达或光探测和测距是一个活跃的遥感系统,可以用来测量广泛地区的植被高度。本文将介绍激光雷达(或激光雷达)的基本概念,包括: 什么是激光雷达数据。 激光雷达数据的关键属性。 如何使用激光雷达数据测量树木。 激光雷达的历史。 Key Concepts Why LiD 阅读全文
posted @ 2020-12-11 19:18 吴建明wujianming 阅读(1257) 评论(0) 推荐(0)
摘要: TVM vs TensorRT比较 如果理解正确的话,TensorRT和TVM会加快预测速度。 TensorRT优化预测GPU和TVM优化预测几乎所有平台支持GPU,ARM,Mobile。。。 两者在GPU上有比较吗? 到目前为止,tvm还没有为TensorRT优化的int8进行优化。但在这方面还有 阅读全文
posted @ 2020-12-11 17:22 吴建明wujianming 阅读(1229) 评论(0) 推荐(0)
摘要: TensorRT宏碁自建云(BYOC, BuildYourOwnCloud)上集成 这个PR增加了对分区、编译和运行TensorRT BYOC目标的支持。 Building 有两个新的cmake标志: USE_TENSORRT=ON/OFF:启用TENSORRT代码生成-这不需要TENSORRT库 阅读全文
posted @ 2020-12-11 16:50 吴建明wujianming 阅读(282) 评论(0) 推荐(0)
摘要: GPU上如何优化卷积 本文将演示如何在TVM中编写高性能卷积实现。我们以平方大小的输入张量和滤波器为例,假设卷积的输入是大批量的。在本例中,使用不同的布局来存储数据,以实现更好的数据局部性。缓冲区布局为HWCN,代表高度、宽度、通道、批次。 Preparation and Algorithm 对于2 阅读全文
posted @ 2020-12-09 16:50 吴建明wujianming 阅读(263) 评论(0) 推荐(0)
摘要: 如何在CPU上优化GEMM(下) Array Packing 另一个重要的技巧是数组打包。这个技巧是对数组的存储维度进行重新排序,将某个维度上的连续访问模式在平滑后转换为顺序模式。 如上图所示,在阻塞计算之后,可以观察到B的数组访问模式(扁平化后),它是规则的但不连续的。期望经过一些转换,可以得到连 阅读全文
posted @ 2020-12-09 16:45 吴建明wujianming 阅读(607) 评论(0) 推荐(0)
摘要: 如何在CPU上优化GEMM(上) (TL;DR)TVM提供了抽象接口,用户分别描述算法和算法的实现组织(所谓的调度)。通常,在高性能调度中编写算法会破坏算法的可读性和模块性。尝试各种看似有希望的时间表是很耗时的。在TVM的帮助下,可以有效地尝试这些调度来提高性能。 本文将演示如何使用TVM优化平方矩 阅读全文
posted @ 2020-12-09 14:06 吴建明wujianming 阅读(505) 评论(0) 推荐(0)
摘要: 编译ONNX模型Compile ONNX Models 本文是一篇介绍如何使用Relay部署ONNX模型的说明。 首先,必须安装ONNX包。 一个快速的解决方案是安装protobuf编译器,然后 pip install onnx –user 或者参考官方网站: https://github.com/ 阅读全文
posted @ 2020-12-09 13:00 吴建明wujianming 阅读(381) 评论(0) 推荐(0)
摘要: 深度学习加速器堆栈Deep Learning Accelerator Stack 通用张量加速器(VTA)是一种开放的、通用的、可定制的深度学习加速器,具有完整的基于TVM的编译器堆栈。设计了VTA来揭示主流深度学习加速器最显著和最常见的特征。TVM和VTA一起构成了一个端到端的软硬件深度学习系统堆 阅读全文
posted @ 2020-12-09 09:27 吴建明wujianming 阅读(461) 评论(0) 推荐(0)
摘要: TVM部署和集成Deploy and Integration 本文包含如何将TVM部署到各种平台以及如何将其与项目集成。 与传统的深度学习框架不同。TVM堆栈分为两个主要组件: TVM编译器,完成所有编译和优化 TVM runtime运行时,在目标设备上运行。 为了集成编译后的模块,不需要在目标设备 阅读全文
posted @ 2020-12-09 09:09 吴建明wujianming 阅读(699) 评论(0) 推荐(0)
上一页 1 ··· 307 308 309 310 311 312 313 314 315 ··· 400 下一页