会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
吴建明
微信视频号:sph0RgSyDYV47z6 快手号:4874645212 抖音号:dy0so323fq2w 小红书号:95619019828 B站1:UID:3546863642871878 B站2:UID: 3546955410049087
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
279
280
281
282
283
284
285
286
287
···
367
下一页
2020年11月28日
TVM源码框架安装方法
摘要: TVM源码框架安装方法 本文提供如何在各种系统上从零构建和安装TVM包的说明。它包括两个步骤: 首先从C++代码中构建共享库(linux的libtvm.so,macOS的libtvm.dylib和windows的libtvm.dll)。 编程语言包的设置(例如Python包)。 实现,请从下载页面下
阅读全文
posted @ 2020-11-28 07:06 吴建明wujianming
阅读(795)
评论(0)
推荐(0)
2020年11月23日
在OpenShift平台上验证NVIDIA DGX系统的分布式多节点自动驾驶AI训练
摘要: 在OpenShift平台上验证NVIDIA DGX系统的分布式多节点自动驾驶AI训练 自动驾驶汽车的深度神经网络(DNN)开发是一项艰巨的工作。本文验证了DGX多节点,多GPU,分布式训练在DXC机器人驱动环境中运行。 还使用了一个机器人学习平台来驱动深度学习(11.3)的工作负载。目前,OpenS
阅读全文
posted @ 2020-11-23 09:02 吴建明wujianming
阅读(653)
评论(0)
推荐(0)
NVIDIA DRIVE AGX开发工具包
摘要: NVIDIA DRIVE AGX开发工具包 英伟达drive™ AGX开发工具包提供了开发生产级自主车辆(AV)所需的硬件、软件和示例应用程序。NVIDIA DRIVE AGX系统建立在汽车产品级芯片上,具有开放的软件框架,并拥有大量汽车合作伙伴(包括产品级传感器供应商、汽车1级供应商)可供选择。
阅读全文
posted @ 2020-11-23 08:13 吴建明wujianming
阅读(824)
评论(0)
推荐(0)
大数据目标检测推理管道部署
摘要: 大数据目标检测推理管道部署 本文提供了一个用于对象检测的深度学习推理的概述。 自主车辆软件开发需要大规模的数据、计算和算法创新,这些都是gpu实现的。一组神经网络构成了感知和决策系统的基础。神经网络的性能与数据量成比例地增加,并且需要基础设施来支持大规模的训练和推理。 为了使自动驾驶汽车(AV)达到
阅读全文
posted @ 2020-11-23 07:51 吴建明wujianming
阅读(250)
评论(0)
推荐(0)
2020年11月21日
使用NVIDIA GRID vPC支持视频会议和算力工具
摘要: 随着2020年的发展,远程工作解决方案已成为许多人的新常态。企业正在寻找行之有效的解决方案,如虚拟桌面基础设施(VDI),以使他们的团队能够在任何地方安全地工作。然而,最新的算力和视频会议应用程序需要更强大的台式机来确保良好的用户体验。 借助NVIDIA GRID vPC,它可以经济高效地将虚拟化扩
阅读全文
posted @ 2020-11-21 12:04 吴建明wujianming
阅读(430)
评论(0)
推荐(0)
使用NVIDIA A100 TF32获得即时加速
摘要: 使用NVIDIA A100 TF32获得即时加速 NVIDIA A100带来了我们公司历史上最大的单代性能增长。这是一个新的结构创新,这是一个多功能的支持,这是一个多功能的结构支持。TF32是用于深度学习训练的绝佳精度,因为它结合了FP32的范围和FP16的精度,与上一代的FP32精度相比,可提供高
阅读全文
posted @ 2020-11-21 11:25 吴建明wujianming
阅读(927)
评论(0)
推荐(0)
使用PCAST检测散度以比较GPU和CPU结果
摘要: 使用PCAST检测散度以比较GPU和CPU结果 并行编译器辅助软件测试(PCAST)是英伟达HPC FORTRAN、C++和C编译器中的一个特性。PCAST有两个用例。一个新的处理器或新的编译程序的部分或新的时间标志首先被编译。您可能需要测试新库是否会产生相同的结果,或者测试添加OpenMP并行、启
阅读全文
posted @ 2020-11-21 10:52 吴建明wujianming
阅读(348)
评论(0)
推荐(0)
用NVIDIA NsightcComputeRoofline分析加速高性能HPC的应用
摘要: 用NVIDIA NsightcComputeRoofline分析加速高性能HPC的应用 编写高性能的软件不是一件简单的任务。当有了可以编译和运行的代码之后,当您尝试并理解它在可用硬件上的执行情况时,将引入一个新的挑战。不同的平台,无论是cpu、gpu还是其他平台,都会有不同的硬件限制,比如可用内存带
阅读全文
posted @ 2020-11-21 09:09 吴建明wujianming
阅读(1191)
评论(0)
推荐(0)
2020年11月10日
Pipe Utilization管道利用率
摘要: Pipe Utilization管道利用率 概述 CUDA设备的每个流式多处理器(SM)都具有许多专门用于执行特定任务的硬件单元。在芯片级,这些单元提供执行管道,翘曲调度程序将指令发送到这些管道。例如,结构单元提供执行结构获取和执行结构过滤的功能。加载/存储单元获取数据并将其保存到内存中。了解这些管
阅读全文
posted @ 2020-11-10 07:55 吴建明wujianming
阅读(447)
评论(1)
推荐(0)
2020年11月8日
Nsight Compute Profilier 分析
摘要: profiler报告包含每次内核启动分析期间收集的所有信息。在用户界面中,它包含一个包含常规信息的标题,以及用于在报告页面或单个收集的启动之间切换的控件。默认情况下,报告以选定的详细信息页面开始。 页眉 页面下拉列表可用于在可用报告页面之间切换,下一节将对此进行详细说明。 探查器报告标头 Launc
阅读全文
posted @ 2020-11-08 18:03 吴建明wujianming
阅读(603)
评论(0)
推荐(0)
上一页
1
···
279
280
281
282
283
284
285
286
287
···
367
下一页
公告