上一页 1 ··· 312 313 314 315 316 317 318 319 320 ··· 400 下一页
摘要: Pipe Utilization管道利用率 概述 CUDA设备的每个流式多处理器(SM)都具有许多专门用于执行特定任务的硬件单元。在芯片级,这些单元提供执行管道,翘曲调度程序将指令发送到这些管道。例如,结构单元提供执行结构获取和执行结构过滤的功能。加载/存储单元获取数据并将其保存到内存中。了解这些管 阅读全文
posted @ 2020-11-10 07:55 吴建明wujianming 阅读(464) 评论(1) 推荐(0)
摘要: profiler报告包含每次内核启动分析期间收集的所有信息。在用户界面中,它包含一个包含常规信息的标题,以及用于在报告页面或单个收集的启动之间切换的控件。默认情况下,报告以选定的详细信息页面开始。 页眉 页面下拉列表可用于在可用报告页面之间切换,下一节将对此进行详细说明。 探查器报告标头 Launc 阅读全文
posted @ 2020-11-08 18:03 吴建明wujianming 阅读(611) 评论(0) 推荐(0)
摘要: 主菜单 文件 新建项目使用“新建项目”对话框创建新的分析项目 4. Main Menu and Toolbar Information on the main menu and toolbar. Main Menu File New Project Create new profiling Proj 阅读全文
posted @ 2020-11-08 17:40 吴建明wujianming 阅读(408) 评论(0) 推荐(0)
摘要: NSight Compute 用户手册(中) NVIDIA Nsight Compute支持密码和私钥身份验证方法。在此对话框中,选择身份验证方法并输入以下信息: 密码 IP/主机名:目标设备的IP地址或主机名。 用户名:用于SSH连接的用户名。 Password:用于SSH连接的用户密码。 端口: 阅读全文
posted @ 2020-11-08 17:20 吴建明wujianming 阅读(1030) 评论(0) 推荐(0)
摘要: NSight Compute 用户手册(上) 非交互式配置文件活动 从NVIDIA Nsight Compute启动目标应用程序 启动NVIDIA Nsight Compute时,将出现欢迎页面。单击快速启动打开连接对话框。如果未显示“连接”对话框,则可以使用主工具栏上的“连接”按钮打开它,只要当前 阅读全文
posted @ 2020-11-08 16:57 吴建明wujianming 阅读(1813) 评论(0) 推荐(0)
摘要: NVIDIA Nsight Systems CUDA 跟踪 CUDA跟踪 NVIDIA Nsight Systems能够捕获有关在概要过程中执行CUDA的信息。 可以在报告的时间轴上收集和呈现以下信息: CUDAAPI跟踪-跟踪应用程序进行的CUDA运行时和CUDA驱动程序调用。 CUDA运行时调用 阅读全文
posted @ 2020-11-08 09:31 吴建明wujianming 阅读(1389) 评论(0) 推荐(0)
摘要: TensorRT Analysis Report 一.介绍 TensorRT是一个高性能的深度学习推理(Inference)优化器,可以为深度学习应用提供低延迟、高吞吐率的部署推理。TensorRT可用于对超大规模数据中心、嵌入式平台或自动驾驶平台进行推理加速。TensorRT现已能支持Tensor 阅读全文
posted @ 2020-11-06 13:35 吴建明wujianming 阅读(1036) 评论(0) 推荐(0)
摘要: 基于TensorRT优化的Machine Translation 机器翻译系统用于将文本从一种语言翻译成另一种语言。递归神经网络(RNN)是机器翻译中最流行的深度学习解决方案之一。 TensorRT机器翻译示例的一些示例包括: Neural Machine Translation (NMT) Usi 阅读全文
posted @ 2020-11-04 08:52 吴建明wujianming 阅读(269) 评论(0) 推荐(0)
摘要: 用TensorRT针对AArch64用户的交叉编译示例 以下介绍如何在x86_64linux下为AArch64 QNX和Linux平台交叉编译TensorRT示例。 2.1. Prerequisites 本节提供分步说明,以确保满足交叉编译的最低要求。 Procedure 1. 为对应的目标安装CU 阅读全文
posted @ 2020-11-04 08:20 吴建明wujianming 阅读(726) 评论(0) 推荐(0)
摘要: Recommenders with TensorRT 推荐系统用于向社交网络、媒体内容消费和电子商务平台的用户提供产品或媒体推荐。基于MLP的神经协作滤波器(NCF)推荐器使用一组完全连接或矩阵乘法层来生成推荐。 TensorRT推荐人示例的一些示例包括: Movie Recommendation 阅读全文
posted @ 2020-11-04 07:58 吴建明wujianming 阅读(252) 评论(0) 推荐(0)
上一页 1 ··· 312 313 314 315 316 317 318 319 320 ··· 400 下一页