吴建明wujianming

2020年11月10日

摘要： Pipe Utilization管道利用率概述 CUDA设备的每个流式多处理器（SM）都具有许多专门用于执行特定任务的硬件单元。在芯片级，这些单元提供执行管道，翘曲调度程序将指令发送到这些管道。例如，结构单元提供执行结构获取和执行结构过滤的功能。加载/存储单元获取数据并将其保存到内存中。了解这些管阅读全文

posted @ 2020-11-10 07:55 吴建明wujianming 阅读(464) 评论(1) 推荐(0)

2020年11月8日

Nsight Compute Profilier 分析

摘要： profiler报告包含每次内核启动分析期间收集的所有信息。在用户界面中，它包含一个包含常规信息的标题，以及用于在报告页面或单个收集的启动之间切换的控件。默认情况下，报告以选定的详细信息页面开始。页眉页面下拉列表可用于在可用报告页面之间切换，下一节将对此进行详细说明。探查器报告标头 Launc 阅读全文

posted @ 2020-11-08 18:03 吴建明wujianming 阅读(611) 评论(0) 推荐(0)

NSight Compute 用户手册（下）

摘要：主菜单文件新建项目使用“新建项目”对话框创建新的分析项目 4. Main Menu and Toolbar Information on the main menu and toolbar. Main Menu File New Project Create new profiling Proj 阅读全文

posted @ 2020-11-08 17:40 吴建明wujianming 阅读(408) 评论(0) 推荐(0)

NSight Compute 用户手册（中）

摘要： NSight Compute 用户手册（中） NVIDIA Nsight Compute支持密码和私钥身份验证方法。在此对话框中，选择身份验证方法并输入以下信息：密码 IP/主机名：目标设备的IP地址或主机名。用户名：用于SSH连接的用户名。 Password：用于SSH连接的用户密码。端口：阅读全文

posted @ 2020-11-08 17:20 吴建明wujianming 阅读(1030) 评论(0) 推荐(0)

NSight Compute 用户手册（上）

摘要： NSight Compute 用户手册（上）非交互式配置文件活动从NVIDIA Nsight Compute启动目标应用程序启动NVIDIA Nsight Compute时，将出现欢迎页面。单击快速启动打开连接对话框。如果未显示“连接”对话框，则可以使用主工具栏上的“连接”按钮打开它，只要当前阅读全文

posted @ 2020-11-08 16:57 吴建明wujianming 阅读(1813) 评论(0) 推荐(0)

NVIDIA Nsight Systems CUDA 跟踪

摘要： NVIDIA Nsight Systems CUDA 跟踪 CUDA跟踪 NVIDIA Nsight Systems能够捕获有关在概要过程中执行CUDA的信息。可以在报告的时间轴上收集和呈现以下信息： CUDAAPI跟踪-跟踪应用程序进行的CUDA运行时和CUDA驱动程序调用。 CUDA运行时调用阅读全文

posted @ 2020-11-08 09:31 吴建明wujianming 阅读(1389) 评论(0) 推荐(0)

2020年11月6日

TensorRT Analysis Report分析报告

摘要： TensorRT Analysis Report 一．介绍 TensorRT是一个高性能的深度学习推理（Inference）优化器，可以为深度学习应用提供低延迟、高吞吐率的部署推理。TensorRT可用于对超大规模数据中心、嵌入式平台或自动驾驶平台进行推理加速。TensorRT现已能支持Tensor 阅读全文

posted @ 2020-11-06 13:35 吴建明wujianming 阅读(1036) 评论(0) 推荐(0)

2020年11月4日

基于TensorRT优化的Machine Translation

摘要：基于TensorRT优化的Machine Translation 机器翻译系统用于将文本从一种语言翻译成另一种语言。递归神经网络（RNN）是机器翻译中最流行的深度学习解决方案之一。 TensorRT机器翻译示例的一些示例包括： Neural Machine Translation (NMT) Usi 阅读全文

posted @ 2020-11-04 08:52 吴建明wujianming 阅读(269) 评论(0) 推荐(0)

用TensorRT针对AArch64用户的交叉编译示例

摘要：用TensorRT针对AArch64用户的交叉编译示例以下介绍如何在x86_64linux下为AArch64 QNX和Linux平台交叉编译TensorRT示例。 2.1. Prerequisites 本节提供分步说明，以确保满足交叉编译的最低要求。 Procedure 1. 为对应的目标安装CU 阅读全文

posted @ 2020-11-04 08:20 吴建明wujianming 阅读(726) 评论(0) 推荐(0)

Recommenders with TensorRT

摘要： Recommenders with TensorRT 推荐系统用于向社交网络、媒体内容消费和电子商务平台的用户提供产品或媒体推荐。基于MLP的神经协作滤波器（NCF）推荐器使用一组完全连接或矩阵乘法层来生成推荐。 TensorRT推荐人示例的一些示例包括： Movie Recommendation 阅读全文

posted @ 2020-11-04 07:58 吴建明wujianming 阅读(252) 评论(0) 推荐(0)

吴建明

微信视频号：sph0RgSyDYV47z6 快手号：4874645212 抖音号：dy0so323fq2w 小红书号：95619019828 B站1：UID:3546863642871878 B站2：UID: 3546955410049087 知乎视频：https://www.zhihu.com/people/wujianming_110117/zvideos 知乎：https://www.zhihu.com/people/wujianming_110117

公告